ビジョン向け事前学習
ビジョントランスフォーマー (ViT)
自然言語処理(NLP)のために元々設計されたトランスフォーマーを、画像をシーケンシャルなパッチに分割することでビジョンタスクに適用するニューラルアーキテクチャ。
← 戻る自然言語処理(NLP)のために元々設計されたトランスフォーマーを、画像をシーケンシャルなパッチに分割することでビジョンタスクに適用するニューラルアーキテクチャ。
← 戻る