Transformadores y Mecanismos de Atención

📂

subcategorías

Mecanismo de Atención

Fundamento matemático que permite a los modelos ponderar la importancia relativa de los elementos en una secuencia de datos.

5 términos

📂

subcategorías

Autoatención

Mecanismo donde cada elemento de una secuencia calcula su atención con respecto a todos los demás elementos de la misma secuencia.

0 términos

📂

subcategorías

Atención de múltiples cabezas

Extensión de la atención que utiliza múltiples cabezas de atención en paralelo para capturar diferentes tipos de relaciones.

3 términos

📂

subcategorías

Codificación posicional

Técnica de incorporación de la posición secuencial de los elementos en los embeddings sin utilizar RNN.

12 términos

📂

subcategorías

Arquitectura codificador-decodificador

Estructura fundamental de los Transformers que separa el procesamiento de entrada (codificador) y la generación de salida (decodificador).

2 términos

📂

subcategorías

Escalado de atención

Normalización por raíz cuadrada de la dimensionalidad para estabilizar el entrenamiento y evitar los gradientes explosivos.

14 términos

📂

subcategorías

Atención cruzada

Mecanismo de atención entre dos secuencias diferentes, utilizado en tareas de traducción y multimodales.

8 términos

📂

subcategorías

Atención dispersa

Variante de atención calculada únicamente sobre un subconjunto de posiciones para reducir la complejidad computacional.

3 términos

📂

subcategorías

Máscaras de atención

Mecanismos de control que permiten enmascarar ciertas posiciones durante el cálculo de atención para evitar las fugas de información.

9 términos

📂

subcategorías

Transformadores de visión

Adaptación de la arquitectura Transformer a las tareas de visión por computadora tratando las imágenes como secuencias de parches.

9 términos

📂

subcategorías

Atención eficiente

Conjunto de optimizaciones destinadas a reducir la complejidad cuadrática de la atención estándar para secuencias más largas.

2 términos

📂

subcategorías

Atención jerárquica

Estructura de atención multinivel capturando relaciones a diferentes escalas jerárquicas en los datos.

12 términos

Glosario IA

Mecanismo de Atención

Autoatención

Atención de múltiples cabezas

Codificación posicional

Arquitectura codificador-decodificador

Escalado de atención

Atención cruzada

Atención dispersa

Máscaras de atención

Transformadores de visión

Atención eficiente

Atención jerárquica

No se encontraron resultados