検出用トランスフォーマー
エンコーダ-デコーダートランスフォーマー
エンコーダが画像特徴を処理して文脈豊かな表現を作成し、デコーダがオブジェクトクエリを使用してこの表現を最終的なボックスとクラスの予測にデコードする構造。
← 戻るエンコーダが画像特徴を処理して文脈豊かな表現を作成し、デコーダがオブジェクトクエリを使用してこの表現を最終的なボックスとクラスの予測にデコードする構造。
← 戻る