マルチモーダルトランスフォーマー
Flamingoモデル
事前学習済みアダプターとアテンショナルゲーティングを使用して、完全な再学習なしでVision Transformersと言語モデルを効率的に組み合わせる800億パラメータのビジョン・言語モデル。
← 戻る事前学習済みアダプターとアテンショナルゲーティングを使用して、完全な再学習なしでVision Transformersと言語モデルを効率的に組み合わせる800億パラメータのビジョン・言語モデル。
← 戻る