Détection avec Architectures Transformer

📖

termes

Query-based Detection

Paradigme de détection où des requêtes apprises (embeddings) interagissent avec les caractéristiques de l'image via un mécanisme d'attention pour prédire directement les boîtes englobantes et les classes des objets.

📖

termes

Object Queries

Vecteurs d'apprentissage positionnels dans les architectures DETR qui agissent comme des 'slots' pour chaque objet potentiel à détecter, guidant le modèle vers des prédictions spécifiques.

📖

termes

Bipartite Matching Loss

Fonction de perte utilisée dans DETR qui trouve l'appariement optimal un-à-un entre les prédictions et les vérités terrain en utilisant l'algorithme hongrois, garantissant une attribution unique pour chaque objet.

📖

termes

Multi-Scale Feature Pyramid

Structure dans les détecteurs transformer qui combine des caractéristiques de différentes résolutions pour améliorer la détection d'objets de tailles variées, souvent via des mécanismes d'attention inter-échelles.

📖

termes

Anchor-Free Detection

Approche de détection qui élimine l'utilisation de boîtes d'ancres prédéfinies, caractéristique clé des architectures transformer qui prédisent directement les boîtes englobantes.

📖

termes

Set Prediction

Formulation de la détection d'objets comme un problème de prédiction d'ensemble non ordonné, où le modèle prédit simultanément tous les objets sans ordre prédéfini.

📖

termes

Class-Agnostic Detection

Approche où la localisation et la classification des objets sont découplées, souvent utilisée dans les détecteurs transformer pour améliorer la généralisation.

📖

termes

Vision Transformer (ViT) Backbone

Utilisation de ViT pré-entraînés comme extracteurs de caractéristiques pour les détecteurs transformer, offrant une représentation puissante et contextuelle des images.

📖

termes

DINO (DETR with Improved deNoising anchOr)

Architecture de détection avancée qui combine des requêtes débruitées et des ancres pour améliorer les performances et la vitesse de convergence des détecteurs transformer.

📖

termes

Denosing Training

Stratégie d'entraînement où le modèle apprend à reconstruire des vérités terrain à partir de versions bruitées, améliorant la robustesse et la convergence des détecteurs transformer.

📖

termes

Query-to-Instance Attention

Mécanisme d'attention spécialisé où chaque requête d'objet se concentre sur les caractéristiques pertinentes d'une instance spécifique dans l'image.

📖

termes

One-to-Many Label Assignment

Stratégie d'assignation alternative dans certains détecteurs transformer où une vérité terrain peut être assignée à plusieurs prédictions pour améliorer l'entraînement.

Glossaire IA

Query-based Detection

Object Queries

Bipartite Matching Loss

Multi-Scale Feature Pyramid

Anchor-Free Detection

Set Prediction

Class-Agnostic Detection

Vision Transformer (ViT) Backbone

DINO (DETR with Improved deNoising anchOr)

Denosing Training

Query-to-Instance Attention

One-to-Many Label Assignment

Aucun résultat trouvé