マルチモーダルトランスフォーマー
BEiT-3
モダリティ固有の埋め込みを持つマルチウェイトランスフォーマーを使用して、画像、テキスト、および画像-テキストを統一的に処理するBidirectional Encoder representation from Image Transformer v3モデル。
← 戻るモダリティ固有の埋め込みを持つマルチウェイトランスフォーマーを使用して、画像、テキスト、および画像-テキストを統一的に処理するBidirectional Encoder representation from Image Transformer v3モデル。
← 戻る