Glosario IA
El diccionario completo de la Inteligencia Artificial
Caja Delimitadora (Bounding Box)
Rectángulo definido por coordenadas (x, y, ancho, alto) que enmarca un objeto detectado en una imagen. Es la salida estándar de los algoritmos de detección de objetos para localizar y delimitar el objetivo.
Intersección sobre Unión (IoU)
Métrica de evaluación que mide la superposición entre la caja delimitadora predicha y la caja delimitadora de verdad fundamental (ground truth). Se calcula como la relación del área de la intersección sobre el área de la unión de las dos cajas.
Caja de Anclaje (Anchor Box)
Caja delimitadora predefinida con un tamaño y una relación de aspecto específicos, utilizada como referencia por los detectores de objetos. El modelo predice los desplazamientos con respecto a estas cajas de anclaje para acelerar y estabilizar el aprendizaje.
Precisión Media Promedio (mAP)
Métrica de referencia para evaluar el rendimiento de un detector de objetos, calculada como la media de las precisiones promedio (Average Precision) sobre todas las clases de objetos. Integra tanto la precisión como la exhaustividad (recall) en diferentes umbrales de confianza.
Región de Interés (RoI)
Área específica de una imagen en la que se centra el análisis o procesamiento. En arquitecturas de dos etapas como Faster R-CNN, las RoI son las áreas candidatas que probablemente contengan un objeto.
Red de Propuesta de Región (RPN)
Componente clave de las arquitecturas de detección de dos etapas (ej: Faster R-CNN) que genera regiones candidatas (RoI) que probablemente contengan objetos. Comparte convoluciones con la red de clasificación para mayor eficiencia.
Detector de Una Etapa (Single-Stage Detector)
Familia de algoritmos (ej: YOLO, SSD) que realizan la detección de objetos en un solo paso sobre la imagen, prediciendo directamente las cajas delimitadoras y las clases. Generalmente son más rápidos pero a veces menos precisos que los detectores de dos etapas.
Detector de Dos Etapas (Two-Stage Detector)
Enfoque de detección que separa el proceso en dos fases: primero la generación de regiones candidatas, y luego la clasificación y refinamiento de las cajas para esas regiones. A menudo ofrece mayor precisión a expensas de la velocidad.
Pirámide de Características (Feature Pyramid)
Estructura que combina mapas de características de múltiples niveles semánticos y resoluciones diferentes. Permite al modelo detectar objetos a diversas escalas en una misma imagen, mejorando la robustez.
Regresión de Caja Delimitadora
Tarea de predicción de las coordenadas exactas (x, y, ancho, alto) de una caja delimitadora. El modelo aprende a ajustar una caja inicial (como una ancla) para alinearla de la mejor manera posible con el objeto real.
Detección de Puntos Clave (Keypoint Detection)
Extensión de la detección de objetos que consiste en localizar puntos anatómicos o estructurales específicos (ej: articulaciones de un cuerpo humano). Se utiliza a menudo para la estimación de la pose.
Segmentación Semántica de Instancia
Tarea avanzada que combina la detección de objetos y la segmentación semántica. Identifica cada instancia de objeto y asigna una máscara de píxeles precisa a cada una, en lugar de una simple caja delimitadora.