マルチモーダルトランスフォーマー
マルチモーダルトランスフォーマー
テキスト、画像、音声、ビデオなど複数のモダリティからのデータを同時に処理し、共通の表現空間に統合するように設計されたトランスフォーマー型ニューラルネットワークアーキテクチャ
← 戻るテキスト、画像、音声、ビデオなど複数のモダリティからのデータを同時に処理し、共通の表現空間に統合するように設計されたトランスフォーマー型ニューラルネットワークアーキテクチャ
← 戻る