Glosario IA
El diccionario completo de la Inteligencia Artificial
Detección basada en consultas
Paradigma de detección donde las consultas aprendidas (embeddings) interactúan con las características de la imagen a través de un mecanismo de atención para predecir directamente las cajas delimitadoras y las clases de los objetos.
Consultas de objetos
Vectores de aprendizaje posicionales en las arquitecturas DETR que actúan como 'slots' para cada objeto potencial a detectar, guiando el modelo hacia predicciones específicas.
Pérdida de correspondencia bipartita
Función de pérdida utilizada en DETR que encuentra la correspondencia óptima uno a uno entre las predicciones y las verdades terreno utilizando el algoritmo húngaro, garantizando una asignación única para cada objeto.
Pirámide de características multiescala
Estructura en los detectores transformer que combina características de diferentes resoluciones para mejorar la detección de objetos de tamaños variados, a menudo a través de mecanismos de atención interescala.
Detección sin anclajes
Enfoque de detección que elimina el uso de cajas de anclaje predefinidas, característica clave de las arquitecturas transformer que predicen directamente las cajas delimitadoras.
Predicción de conjuntos
Formulación de la detección de objetos como un problema de predicción de conjuntos no ordenados, donde el modelo predice simultáneamente todos los objetos sin un orden predefinido.
Detección agnóstica a clases
Enfoque donde la localización y la clasificación de objetos están desacopladas, a menudo utilizado en los detectores transformer para mejorar la generalización.
Backbone Vision Transformer (ViT)
Uso de ViT preentrenados como extractores de características para los detectores transformer, ofreciendo una representación potente y contextual de las imágenes.
DINO (DETR con Mejorado Ancla de Eliminación de Ruido)
Arquitectura de detección avanzada que combina consultas sin ruido y anclas para mejorar el rendimiento y la velocidad de convergencia de los detectores transformer.
Entrenamiento de Eliminación de Ruido
Estrategia de entrenamiento donde el modelo aprende a reconstruir verdades terreno a partir de versiones con ruido, mejorando la robustez y la convergencia de los detectores transformer.
Atención Consulta-a-Instancia
Mecanismo de atención especializado donde cada consulta de objeto se concentra en las características relevantes de una instancia específica en la imagen.
Asignación de Etiquetas Uno-a-Muchos
Estrategia de asignación alternativa en algunos detectores transformer donde una verdad terreno puede ser asignada a múltiples predicciones para mejorar el entrenamiento.