マルチモーダルトランスフォーマー
MDETR (Modulated Detection for End-to-End Multi-Modal Understanding)
自然言語で変調されたエンドツーエンドの物体検出アーキテクチャで、複雑なテキストクエリを使用して画像内の物体を特定・識別することができます。
← 戻る自然言語で変調されたエンドツーエンドの物体検出アーキテクチャで、複雑なテキストクエリを使用して画像内の物体を特定・識別することができます。
← 戻る