マルチモーダルトランスフォーマー
ALIGN
自動的にフィルタリングされた10億組のノイズを含む画像-テキストペアで学習された対照的モデル。大規模マルチモーダル学習において、データ量がノイズを補償できることを実証している。
← 戻る自動的にフィルタリングされた10億組のノイズを含む画像-テキストペアで学習された対照的モデル。大規模マルチモーダル学習において、データ量がノイズを補償できることを実証している。
← 戻る