マルチモーダル対応大規模言語モデル(LLM)では、画像を与えることで、その画像について会話することができる

マルチモーダル対応大規模言語モデル(LLM)では、画像を与えることで、その画像について会話することができる