AutoInt

📖

términos

Arquitectura de red neuronal profunda diseñada para modelar automáticamente las interacciones de características de alto orden en datos tabulares, utilizando un mecanismo de atención multi-cabezal.

📖

términos

Mecanismo de Atención Multi-Cabezal

Módulo que permite al modelo centrarse simultáneamente en diferentes posiciones de la secuencia de entrada, aprendiendo múltiples representaciones de atención en paralelo para capturar dependencias complejas.

📖

términos

Interacción de Características de Alto Orden

Combinación no lineal de tres o más variables de entrada, cuya captura es esencial para mejorar el poder predictivo de los modelos sobre datos estructurados complejos.

📖

términos

Incrustación de Características

Representación vectorial densa y de baja dimensión de características categóricas, permitiendo al modelo tratar estas variables como entradas continuas y aprender sus relaciones semánticas.

📖

términos

Red de Interacción

Subred dentro de AutoInt responsable del cálculo explícito de las interacciones entre los vectores de incrustación de características, antes de la aplicación del mecanismo de atención.

📖

términos

Valor de Atención

Puntuación ponderada calculada por el mecanismo de atención que cuantifica la importancia de una característica o interacción específica para la predicción final del modelo.

📖

términos

Pooling de Atención

Operación de agregación que utiliza los pesos de atención para combinar las representaciones de características, produciendo un vector de contexto que resalta la información más relevante.

📖

términos

Aprendizaje por Interacción Automática

Paradigma donde el modelo descubre y jerarquiza por sí mismo las interacciones de características relevantes sin necesidad de ingeniería manual o especificación a priori.

📖

términos

Vector de Consulta (Query Vector)

En el mecanismo de atención, vector que representa el estado actual del modelo y se utiliza para calcular el puntaje de compatibilidad con cada vector clave (key).

📖

términos

Vector Clave (Key Vector)

Representación de una característica o interacción candidata, utilizada para ser comparada con el vector de consulta para determinar su nivel de atención.

📖

términos

Vector de Valor (Value Vector)

Vector que contiene la información real de una característica, que es ponderada por el puntaje de atención y agregada para formar la salida del mecanismo de atención.

📖

términos

Producto Escalar Escalado

Función de similitud utilizada en la atención para calcular los puntajes, donde el producto escalar es dividido por la raíz cuadrada de la dimensión de los vectores para estabilizar el entrenamiento.

📖

términos

Residuo y Normalización de Capa

Técnica de arquitectura donde la salida de una capa es añadida a su entrada (conexión residual) y luego normalizada, facilitando el entrenamiento de redes profundas como AutoInt.

📖

términos

Interacción Cruzada (Cross Interaction)

Operación específica en AutoInt que calcula las interacciones entre pares de características utilizando una multiplicación elemento por elemento seguida de una transformación lineal.

📖

términos

Cabeza de Atención (Attention Head)

Uno de los múltiples mecanismos de atención funcionando en paralelo en un módulo multicabezal, cada uno aprendiendo a enfocarse en diferentes aspectos de las interacciones de características.

📖

términos

Agregación de Cabezas

Proceso de concatenación o promediado de las salidas de todas las cabezas de atención para formar una representación unificada antes de pasarla a la siguiente capa.

📖

términos

Modelado de Dependencias a Largo Alcance

Capacidad del mecanismo de atención para capturar relaciones entre características distantes en el espacio de embedding, superando las limitaciones de los modelos locales como las CNN.

📖

términos

Interpretabilidad mediante Mapa de Atención

Método para visualizar y comprender las decisiones del modelo analizando los pesos de atención, revelando qué interacciones de características fueron las más influyentes.

Glosario IA

AutoInt

Mecanismo de Atención Multi-Cabezal

Interacción de Características de Alto Orden

Incrustación de Características

Red de Interacción

Valor de Atención

Pooling de Atención

Aprendizaje por Interacción Automática

Vector de Consulta (Query Vector)

Vector Clave (Key Vector)

Vector de Valor (Value Vector)

Producto Escalar Escalado

Residuo y Normalización de Capa

Interacción Cruzada (Cross Interaction)

Cabeza de Atención (Attention Head)

Agregación de Cabezas

Modelado de Dependencias a Largo Alcance

Interpretabilidad mediante Mapa de Atención

No se encontraron resultados