マルチモーダル学習とは?
まるちもーだるがくしゅう
文章と画像など複数の情報を組み合わせて学習するAIだよ。
『マルチモーダル学習』は目で見た画像と言葉の説明を同時に学習することで「この写真には犬がいる」と理解できるようなAIを作る方法だよ。
つかいかた・れいぶん
写真を見せながら「これは何?」と質問するとAIが答えてくれるのはマルチモーダル学習のおかげだよ。
このことばを シェア
さいごの こうしん: