🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Transformer Post-LN

Arquitectura original de transformador donde la normalización de capa se aplica después de las capas de atención y feed-forward, requiriendo un ajuste más preciso de la tasa de aprendizaje.

📖
términos

Gamma y Beta

Parámetros aprendibles de la normalización de capa que permiten, respectivamente, escalar (scale) y desplazar (shift) los valores normalizados para preservar la capacidad de representación de la red.

📖
términos

Centrado en Cero

Proceso de restar la media de las activaciones en la normalización de capa para centrar los datos alrededor de cero, facilitando la optimización de los gradientes.

📖
términos

Varianza Unitaria

Estandarización de las activaciones para tener una varianza unitaria en la normalización de capa, asegurando estabilidad numérica y gradientes constantes a través de las capas.

📖
términos

Estabilidad del Gradiente

Propiedad de la normalización de capa que mantiene gradientes estables durante la retropropagación, evitando problemas de gradiente explosivo o desvaneciente en transformadores profundos.

📖
términos

Parámetro Épsilon

Pequeña constante añadida al denominador en la normalización de capa para evitar la división por cero y asegurar la estabilidad numérica al calcular la varianza normalizada.

📖
términos

Distribución de Activación

Distribución de los valores de activación en una capa que la normalización de capa mantiene constante, facilitando la convergencia y optimización de las redes de transformadores.

📖
términos

Invariancia de Escala

Propiedad de la normalización de capa que hace que el modelo sea insensible a los cambios de escala de las entradas, mejorando la robustez del modelo frente a las variaciones de datos.

📖
términos

Velocidad de Entrenamiento

Aceleración significativa del entrenamiento de transformadores gracias a la normalización de capas, permitiendo tasas de aprendizaje más altas y una convergencia más rápida.

📖
términos

Normalización del Estado Oculto

Aplicación de la normalización de capas a los estados ocultos de los transformadores para mantener activaciones estables a través de las diferentes capas de codificación y decodificación.

🔍

No se encontraron resultados