Glosarium AI
Kamus lengkap Kecerdasan Buatan
SSD (Single Shot MultiBox Detector)
Object detection architecture that eliminates region proposals by using default anchor boxes at multiple scales on feature maps of different resolutions for fast and accurate detection.
Anchor Boxes
Sets of predefined boxes with specific heights and widths used as references to predict object bounding boxes, accelerating convergence and improving accuracy in one-stage detectors.
RetinaNet
One-stage detection architecture introducing the Focal Loss function to solve the extreme imbalance problem between background and foreground classes, achieving performance comparable to two-stage models.
Detection Efficiency
Performance measure that evaluates the trade-off between detection accuracy and inference speed, often expressed in frames per second (FPS) for a given mean accuracy (mAP).
Feature Map
Spatial representation of features extracted by a convolutional neural network layer, where each point corresponds to a region of the input image and encodes semantic information for detection.
Receptive Field
Region of the input image that influences a particular neuron in a feature map, whose size increases with network depth and is crucial for detecting objects at different scales.
Dense Detection
Detection strategy that predicts objects at every spatial position of the feature map, unlike sparse methods, allowing more complete detection but requiring efficient management of redundant predictions.
Multi-Scale
Detection approach that processes features at different spatial resolutions simultaneously to improve detection of objects of varying sizes, often implemented through feature pyramids or parallel branches.
Score de confiance (Confidence Score)
Valeur de probabilité prédite par le modèle indiquant le degré de certitude qu'une boîte englobante contient un objet d'une classe spécifique, utilisée pour le filtrage et l'évaluation des détections.
Région d'intérêt (Region of Interest)
Zone spécifique de l'image sur laquelle le modèle se concentre pour la détection ou la classification, dans les détecteurs en une étape implicitement définie par les prédictions sur la grille de caractéristiques.
Backbone
Réseau neuronal convolutif pré-entraîné (comme ResNet, VGG, ou Darknet) utilisé comme extracteur de caractéristiques principal dans une architecture de détection, fournissant les représentations visuelles fondamentales.
Tête de détection (Detection Head)
Module final d'un détecteur en une étape qui prend les caractéristiques extraites par le backbone et prédit les boîtes englobantes, les classes et les scores de confiance pour chaque position de la grille.
Décalage de boîte (Box Offset)
Prédiction de décalage par rapport aux boîtes d'ancres prédéfinies pour affiner la localisation des objets, représentant les différences en coordonnées (x, y) et en dimensions (largeur, hauteur) entre la prédiction et l'ancre.