マルチモーダル翻訳
マルチモーダル埋め込み
異なるモダリティ(テキスト、画像、音声)が数学的に比較・操作できる共有空間内のベクトル表現。これらの埋め込みは検索や類似性などのクロスモーダル意味操作を可能にする。
← 戻る異なるモダリティ(テキスト、画像、音声)が数学的に比較・操作できる共有空間内のベクトル表現。これらの埋め込みは検索や類似性などのクロスモーダル意味操作を可能にする。
← 戻る