検出のためのVision Transformers
トランスフォーマーデコーダーヘッド
DETRアーキテクチャの最終モジュールで、オブジェクトクエリへの注意を通じてエンコーダ特徴をバウンディングボックスとクラスの予測に変換する。
← 戻るDETRアーキテクチャの最終モジュールで、オブジェクトクエリへの注意を通じてエンコーダ特徴をバウンディングボックスとクラスの予測に変換する。
← 戻る