Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Query-based Detection
Paradigme de détection où des requêtes apprises (embeddings) interagissent avec les caractéristiques de l'image via un mécanisme d'attention pour prédire directement les boîtes englobantes et les classes des objets.
Object Queries
Vecteurs d'apprentissage positionnels dans les architectures DETR qui agissent comme des 'slots' pour chaque objet potentiel à détecter, guidant le modèle vers des prédictions spécifiques.
Bipartite Matching Loss
Fonction de perte utilisée dans DETR qui trouve l'appariement optimal un-à-un entre les prédictions et les vérités terrain en utilisant l'algorithme hongrois, garantissant une attribution unique pour chaque objet.
Multi-Scale Feature Pyramid
Structure dans les détecteurs transformer qui combine des caractéristiques de différentes résolutions pour améliorer la détection d'objets de tailles variées, souvent via des mécanismes d'attention inter-échelles.
Anchor-Free Detection
Approche de détection qui élimine l'utilisation de boîtes d'ancres prédéfinies, caractéristique clé des architectures transformer qui prédisent directement les boîtes englobantes.
Set Prediction
Formulation de la détection d'objets comme un problème de prédiction d'ensemble non ordonné, où le modèle prédit simultanément tous les objets sans ordre prédéfini.
Class-Agnostic Detection
Approche où la localisation et la classification des objets sont découplées, souvent utilisée dans les détecteurs transformer pour améliorer la généralisation.
Vision Transformer (ViT) Backbone
Utilisation de ViT pré-entraînés comme extracteurs de caractéristiques pour les détecteurs transformer, offrant une représentation puissante et contextuelle des images.
DINO (DETR with Improved deNoising anchOr)
Architecture de détection avancée qui combine des requêtes débruitées et des ancres pour améliorer les performances et la vitesse de convergence des détecteurs transformer.
Denosing Training
Stratégie d'entraînement où le modèle apprend à reconstruire des vérités terrain à partir de versions bruitées, améliorant la robustesse et la convergence des détecteurs transformer.
Query-to-Instance Attention
Mécanisme d'attention spécialisé où chaque requête d'objet se concentre sur les caractéristiques pertinentes d'une instance spécifique dans l'image.
One-to-Many Label Assignment
Stratégie d'assignation alternative dans certains détecteurs transformer où une vérité terrain peut être assignée à plusieurs prédictions pour améliorer l'entraînement.