Glosario IA
El diccionario completo de la Inteligencia Artificial
Bandidos contextuales
Extensión de los bandidos clásicos donde las decisiones dependen de contextos o estados observables para personalizar las elecciones.
Arrepentimiento en optimización
Medida de rendimiento que cuantifica la diferencia entre la ganancia acumulada obtenida y la ganancia óptima posible con información perfecta.
Exploración lineal
Estrategia de exploración donde la probabilidad de explorar disminuye linealmente con el tiempo para favorecer la explotación progresiva.
Bandido de gradiente
Algoritmo que utiliza estimaciones de gradiente para ajustar las preferencias de acción basadas en las recompensas recibidas.
Optimización PAC
Marco Probably Approximately Correct (Probablemente Aproximadamente Correcto) que garantiza con probabilidad 1-δ que el error es menor que ε después de un número de ensayos.