マルチモーダルトランスフォーマー
マルチモーダルトランスフォーマー
テキスト、画像、音声などの複数のモダリティを同時に処理できる拡張トランスフォーマーアーキテクチャで、クロスアテンションメカニズムを使用してモーダル間の情報を統合します。
← 戻るテキスト、画像、音声などの複数のモダリティを同時に処理できる拡張トランスフォーマーアーキテクチャで、クロスアテンションメカニズムを使用してモーダル間の情報を統合します。
← 戻る