Glosario IA
El diccionario completo de la Inteligencia Artificial
BFGS
Algoritmo de optimización cuasi-Newton iterativo que aproxima la matriz hessiana inversa para encontrar el mínimo de una función sin restricciones.
Aproximación Hessiana
Técnica que consiste en estimar la matriz de las segundas derivadas de una función sin cálculo directo, utilizando la información del gradiente para construir una aproximación iterativa.
Matriz inversa aproximada
Aproximación de la inversa de la matriz hessiana construida progresivamente en los métodos cuasi-Newton para determinar la dirección de descenso óptima.
Búsqueda de línea
Proceso iterativo que determina la longitud de paso óptima en la dirección de descenso para minimizar la función objetivo en cada iteración.
Corrección BFGS
Fórmula de actualización de la aproximación hessiana que preserva la simetría y la definida positividad de la matriz, al tiempo que satisface la ecuación secante.
Memoria limitada
Estrategia en L-BFGS que consiste en conservar solo un número fijo de iteraciones previas para reconstruir la aproximación hessiana, reduciendo la complejidad espacial.
Convergencia superlineal
Propiedad de los métodos BFGS donde la razón de los errores sucesivos tiende a cero, ofreciendo una convergencia más rápida que la lineal pero menos que la cuadrática.
Ecuación secante
Condición impuesta en los métodos cuasi-Newton que garantiza que la aproximación hessiana transforma correctamente la diferencia de gradientes en diferencia de puntos.
Factor de escala
Parámetro inicial en L-BFGS que ajusta la aproximación hessiana inicial para mejorar la convergencia en problemas mal condicionados.
Vector de corrección
Par de vectores (s, y) almacenados en L-BFGS donde s representa el desplazamiento y y la diferencia de gradiente, utilizados para reconstruir la aproximación hessiana.
Dirección de descenso
Vector calculado multiplicando la aproximación hessiana inversa por el gradiente negativo, indicando la dirección óptima para minimizar la función.
Hessiana inicial
Matriz de partida en los métodos cuasi-Newton, típicamente una matriz identidad multiplicada por un factor de escala, sirviendo de base para las iteraciones sucesivas.
Algoritmo de dos bucles
Implementación eficiente de L-BFGS que utiliza dos bucles para calcular la dirección de descenso sin reconstruir explícitamente la matriz hessiana completa.