🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Método de Newton Estocástico

Algoritmo de optimización que aproxima la matriz Hessiana de manera estocástica para acelerar la convergencia, combinando la eficiencia computacional del SGD con las propiedades de convergencia de segundo orden.

📖
términos

L-BFGS (BFGS de memoria limitada)

Variante cuasi-Newton que aproxima la matriz Hessiana inversa utilizando solo las últimas m iteraciones, reduciendo drásticamente la complejidad de la memoria mientras conserva las ventajas de segundo orden.

📖
términos

K-FAC (Curvatura Aproximada Factorizada por Kronecker)

Método de optimización de segundo orden que aproxima la matriz de Fisher mediante un producto de Kronecker de matrices más pequeñas, permitiendo cálculos eficientes para redes neuronales profundas.

📖
términos

Descenso de Gradiente Natural

Algoritmo de optimización que utiliza la métrica de información de Fisher como preacondicionador, garantizando una convergencia invariante a las reparametrizaciones del modelo.

📖
términos

AdaHessian

Optimizador adaptativo que estima la diagonal de la matriz Hessiana utilizando una aproximación de Hutchinson, adaptando la tasa de aprendizaje para cada parámetro basándose en la curvatura local.

📖
términos

Optimizador Shampoo

Optimizador de segundo orden que preacondiciona los gradientes utilizando aproximaciones de matrices de Kronecker para los tensores de pesos, adaptativo a la estructura de los parámetros del modelo.

📖
términos

LAMB (Optimizador de Momentos Adaptativos por Capa)

Optimizador adaptativo que ajusta la tasa de aprendizaje por capa utilizando la norma de los pesos y los gradientes, combinando las ventajas de Adam con una adaptación específica a la estructura de la red.

📖
términos

Optimizador Sophia

Método de optimización de segundo orden que combina estimaciones de Hessiana diagonal con un control de impulso estocástico, adaptando dinámicamente la dirección de actualización según la curvatura local.

📖
términos

Método de Newton Submuestreado

Variante de Newton que utiliza subconjuntos de datos para estimar el gradiente y la Hessiana, reduciendo la complejidad computacional mientras preserva las propiedades de convergencia cuadrática local.

📖
términos

Cuasi-Newton Estocástico

Clase de algoritmos que mantienen una aproximación de la inversa de la Hessiana actualizada de manera estocástica, equilibrando la complejidad computacional y la tasa de convergencia.

📖
términos

Gauss-Newton Diagonal

Aproximación de la Hessiana que utiliza solo los elementos diagonales de la matriz de Gauss-Newton, reduciendo significativamente los costos computacionales para problemas de gran dimensión.

📖
términos

TNSR (Regularización de Segundo Orden Normalizada por Tensor)

Método que aplica una regularización de segundo orden normalizando los tensores de gradientes según las estimaciones de curvatura, estabilizando el entrenamiento de redes profundas.

📖
términos

Paso de Newton en Línea

Algoritmo de optimización en línea que mantiene una aproximación de la Hessiana inversa para adaptar dinámicamente las actualizaciones de los parámetros según las observaciones secuenciales.

📖
términos

Algoritmo de Gradiente Recursivo Estocástico

Método que utiliza técnicas de recursividad para aproximar eficientemente la información de segundo orden manteniendo la complejidad lineal del SGD clásico.

🔍

No se encontraron resultados