ニュース

Stability AI Japan、日本語で画像について説明できる「Japanese InstructBLIP Alpha」をリリース

 Stability AI Japan株式会社は8月17日、日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を公開した。入力した画像に対して文字で説明を生成できる画像キャプション機能を備えるほか、画像に関する質問を文字入力すると日本語で回答するといったことが可能。なお、研究目的での利用に限定した公開としている。

 同モデルは8月10日に公開した日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張したモデルで、日本語テキストに対応しており、東京スカイツリーや金閣寺など日本特有の建造物に関しても正しく認識することができるという。

 同社では、画像を用いた検索エンジン、情景説明や質疑応答のほか、目の不自由な人に向けて画像を文字で説明するといった活用例を挙げている。

入力された画像についての質問に日本語で返答することも可能

 Japanese InstructBLIP Alphaは、同社が発表する最初の画像言語モデルであり、今後も日本向けの生成基盤モデルを構築・公開することで、「日本のAIコミュニティのさらなる活性化に貢献していく予定」とコメントしている。