Glosario IA
El diccionario completo de la Inteligencia Artificial
SSD (Single Shot MultiBox Detector)
Arquitectura de detección de objetos que elimina las propuestas de regiones utilizando cajas de ancla predeterminadas a múltiples escalas en mapas de características de diferentes resoluciones para una detección rápida y precisa.
Cajas de ancla (Anchor Boxes)
Conjuntos de cajas predefinidas con alturas y anchos específicos utilizados como referencias para predecir las cajas delimitadoras de los objetos, acelerando la convergencia y mejorando la precisión en los detectores de un solo paso.
RetinaNet
Arquitectura de detección de un solo paso que introduce la función de pérdida Focal Loss para resolver el problema del desequilibrio extremo entre las clases de fondo y primer plano, alcanzando un rendimiento comparable a los modelos de dos pasos.
Eficiencia de detección (Detection Efficiency)
Medida de rendimiento que evalúa el equilibrio entre la precisión de detección y la velocidad de inferencia, a menudo expresada en imágenes por segundo (FPS) para una precisión media (mAP) dada.
Mapa de características (Feature Map)
Representación espacial de las características extraídas por una capa de red neuronal convolucional, donde cada punto corresponde a una región de la imagen de entrada y codifica información semántica para la detección.
Campo receptivo (Receptive Field)
Región de la imagen de entrada que influye en una neurona particular en un mapa de características, cuyo tamaño aumenta con la profundidad de la red y es crucial para detectar objetos a diferentes escalas.
Detección densa (Dense Detection)
Estrategia de detección que predice objetos en cada posición espacial del mapa de caractéristicas, a diferencia de los métodos dispersos, permitiendo una detección más completa pero requiriendo una gestión eficaz de las predicciones redundantes.
Múltiples escalas (Multi-Scale)
Enfoque de detección que procesa simultáneamente características a diferentes resoluciones espaciales para mejorar la detección de objetos de diversos tamaños, a menudo implementado a través de pirámides de características o ramas paralelas.
Puntuación de confianza (Confidence Score)
Valor de probabilidad predicho por el modelo que indica el grado de certeza de que una caja delimitadora contiene un objeto de una clase específica, utilizado para el filtrado y la evaluación de detecciones.
Región de interés (Region of Interest)
Zona específica de la imagen en la que el modelo se concentra para la detección o clasificación, en los detectores de una etapa implícitamente definida por las predicciones en la cuadrícula de características.
Backbone
Red neuronal convolucional pre-entrenada (como ResNet, VGG, o Darknet) utilizada como extractor de características principal en una arquitectura de detección, proporcionando las representaciones visuales fundamentales.
Cabeza de detección (Detection Head)
Módulo final de un detector de una etapa que toma las características extraídas por el backbone y predice las cajas delimitadoras, las clases y las puntuaciones de confianza para cada posición de la cuadrícula.
Desplazamiento de caja (Box Offset)
Predicción de desplazamiento con respecto a las cajas de anclaje predefinidas para refinar la localización de los objetos, representando las diferencias en coordenadas (x, y) y dimensiones (ancho, altura) entre la predicción y el ancla.