Detección con Arquitecturas Transformer

📖

términos

Detección basada en consultas

Paradigma de detección donde las consultas aprendidas (embeddings) interactúan con las características de la imagen a través de un mecanismo de atención para predecir directamente las cajas delimitadoras y las clases de los objetos.

📖

términos

Consultas de objetos

Vectores de aprendizaje posicionales en las arquitecturas DETR que actúan como 'slots' para cada objeto potencial a detectar, guiando el modelo hacia predicciones específicas.

📖

términos

Pérdida de correspondencia bipartita

Función de pérdida utilizada en DETR que encuentra la correspondencia óptima uno a uno entre las predicciones y las verdades terreno utilizando el algoritmo húngaro, garantizando una asignación única para cada objeto.

📖

términos

Pirámide de características multiescala

Estructura en los detectores transformer que combina características de diferentes resoluciones para mejorar la detección de objetos de tamaños variados, a menudo a través de mecanismos de atención interescala.

📖

términos

Detección sin anclajes

Enfoque de detección que elimina el uso de cajas de anclaje predefinidas, característica clave de las arquitecturas transformer que predicen directamente las cajas delimitadoras.

📖

términos

Predicción de conjuntos

Formulación de la detección de objetos como un problema de predicción de conjuntos no ordenados, donde el modelo predice simultáneamente todos los objetos sin un orden predefinido.

📖

términos

Detección agnóstica a clases

Enfoque donde la localización y la clasificación de objetos están desacopladas, a menudo utilizado en los detectores transformer para mejorar la generalización.

📖

términos

Backbone Vision Transformer (ViT)

Uso de ViT preentrenados como extractores de características para los detectores transformer, ofreciendo una representación potente y contextual de las imágenes.

📖

términos

DINO (DETR con Mejorado Ancla de Eliminación de Ruido)

Arquitectura de detección avanzada que combina consultas sin ruido y anclas para mejorar el rendimiento y la velocidad de convergencia de los detectores transformer.

📖

términos

Entrenamiento de Eliminación de Ruido

Estrategia de entrenamiento donde el modelo aprende a reconstruir verdades terreno a partir de versiones con ruido, mejorando la robustez y la convergencia de los detectores transformer.

📖

términos

Atención Consulta-a-Instancia

Mecanismo de atención especializado donde cada consulta de objeto se concentra en las características relevantes de una instancia específica en la imagen.

📖

términos

Asignación de Etiquetas Uno-a-Muchos

Estrategia de asignación alternativa en algunos detectores transformer donde una verdad terreno puede ser asignada a múltiples predicciones para mejorar el entrenamiento.

Glosario IA

Detección basada en consultas

Consultas de objetos

Pérdida de correspondencia bipartita

Pirámide de características multiescala

Detección sin anclajes

Predicción de conjuntos

Detección agnóstica a clases

Backbone Vision Transformer (ViT)

DINO (DETR con Mejorado Ancla de Eliminación de Ruido)

Entrenamiento de Eliminación de Ruido

Atención Consulta-a-Instancia

Asignación de Etiquetas Uno-a-Muchos

No se encontraron resultados