ニュース

サイバーエージェント、独自の日本語LLMに“視覚”を付与した75億パラメーターの「VLM」を公開

 株式会社サイバーエージェントは、75億パラメーターの日本語VLM(大規模視覚言語モデル)のベースモデルをHugging Face Hubで公開した。Apache-2.0ライセンスで提供されており、商用利用も可能だとしている。

 この日本語VLMは、サイバーエージェント独自の日本語LLM「CyberAgentLM2」をもとに、視覚――画像中の情報を読み取る機能をを付与したもの。同モデルをベースとしてチューニングすることで、画像を加味した対話AIなどの開発が可能になるとしている。