Glosario IA

El diccionario completo de la Inteligencia Artificial

231

categorías

2.999

subcategorías

35.535

términos

📖

términos

Transformer Post-LN

Arquitectura original de transformador donde la normalización de capa se aplica después de las capas de atención y feed-forward, requiriendo un ajuste más preciso de la tasa de aprendizaje.

📖

términos

Gamma y Beta

Parámetros aprendibles de la normalización de capa que permiten, respectivamente, escalar (scale) y desplazar (shift) los valores normalizados para preservar la capacidad de representación de la red.

📖

términos

Centrado en Cero

Proceso de restar la media de las activaciones en la normalización de capa para centrar los datos alrededor de cero, facilitando la optimización de los gradientes.

📖

términos

Varianza Unitaria

Estandarización de las activaciones para tener una varianza unitaria en la normalización de capa, asegurando estabilidad numérica y gradientes constantes a través de las capas.

📖

términos

Estabilidad del Gradiente

Propiedad de la normalización de capa que mantiene gradientes estables durante la retropropagación, evitando problemas de gradiente explosivo o desvaneciente en transformadores profundos.

📖

términos

Parámetro Épsilon

Pequeña constante añadida al denominador en la normalización de capa para evitar la división por cero y asegurar la estabilidad numérica al calcular la varianza normalizada.

📖

términos

Distribución de Activación

Distribución de los valores de activación en una capa que la normalización de capa mantiene constante, facilitando la convergencia y optimización de las redes de transformadores.

📖

términos

Invariancia de Escala

Propiedad de la normalización de capa que hace que el modelo sea insensible a los cambios de escala de las entradas, mejorando la robustez del modelo frente a las variaciones de datos.

📖

términos

Velocidad de Entrenamiento

Aceleración significativa del entrenamiento de transformadores gracias a la normalización de capas, permitiendo tasas de aprendizaje más altas y una convergencia más rápida.

📖

términos

Normalización del Estado Oculto

Aplicación de la normalización de capas a los estados ocultos de los transformadores para mantener activaciones estables a través de las diferentes capas de codificación y decodificación.

🔍

Glosario IA

Transformer Post-LN

Gamma y Beta

Centrado en Cero

Varianza Unitaria

Estabilidad del Gradiente

Parámetro Épsilon

Distribución de Activación

Invariancia de Escala

Velocidad de Entrenamiento

Normalización del Estado Oculto

No se encontraron resultados