Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
SSD (Single Shot MultiBox Detector)
Architecture de détection d'objets qui élimine les propositions de régions en utilisant des boîtes d'ancres par défaut à plusieurs échelles sur des cartes de caractéristiques de différentes résolutions pour une détection rapide et précise.
Boîtes d'ancres (Anchor Boxes)
Ensembles de boîtes prédéfinis avec des hauteurs et largeurs spécifiques utilisés comme références pour prédire les boîtes englobantes des objets, accélérant la convergence et améliorant la précision dans les détecteurs en une étape.
RetinaNet
Architecture de détection en une étape introduisant la fonction de perte Focal Loss pour résoudre le problème du déséquilibre extrême entre les classes d'arrière-plan et de premier plan, atteignant des performances comparables aux modèles en deux étapes.
Efficacité de détection (Detection Efficiency)
Mesure de performance qui évalue le compromis entre la précision de détection et la vitesse d'inférence, souvent exprimée en images par seconde (FPS) pour une précision moyenne (mAP) donnée.
Carte de caractéristiques (Feature Map)
Représentation spatiale des caractéristiques extraites par une couche de réseau de neurones convolutifs, où chaque point correspond à une région de l'image d'entrée et encode des informations sémantiques pour la détection.
Réceptif Champ (Receptive Field)
Région de l'image d'entrée qui influence un neurone particulier dans une carte de caractéristiques, dont la taille augmente avec la profondeur du réseau et est cruciale pour détecter des objets à différentes échelles.
Détection dense (Dense Detection)
Stratégie de détection qui prédit des objets à chaque position spatiale de la carte de caractéristiques, contrairement aux méthodes éparses, permettant une détection plus complète mais nécessitant une gestion efficace des prédictions redondantes.
Échelles multiples (Multi-Scale)
Approche de détection qui traite simultanément des caractéristiques à différentes résolutions spatiales pour améliorer la détection d'objets de tailles variées, souvent implémentée via des pyramides de caractéristiques ou des branches parallèles.
Score de confiance (Confidence Score)
Valeur de probabilité prédite par le modèle indiquant le degré de certitude qu'une boîte englobante contient un objet d'une classe spécifique, utilisée pour le filtrage et l'évaluation des détections.
Région d'intérêt (Region of Interest)
Zone spécifique de l'image sur laquelle le modèle se concentre pour la détection ou la classification, dans les détecteurs en une étape implicitement définie par les prédictions sur la grille de caractéristiques.
Backbone
Réseau neuronal convolutif pré-entraîné (comme ResNet, VGG, ou Darknet) utilisé comme extracteur de caractéristiques principal dans une architecture de détection, fournissant les représentations visuelles fondamentales.
Tête de détection (Detection Head)
Module final d'un détecteur en une étape qui prend les caractéristiques extraites par le backbone et prédit les boîtes englobantes, les classes et les scores de confiance pour chaque position de la grille.
Décalage de boîte (Box Offset)
Prédiction de décalage par rapport aux boîtes d'ancres prédéfinies pour affiner la localisation des objets, représentant les différences en coordonnées (x, y) et en dimensions (largeur, hauteur) entre la prédiction et l'ancre.