Glosario IA
El diccionario completo de la Inteligencia Artificial
Función de Covarianza
Función núcleo que define la similitud entre puntos en un proceso gaussiano, determinando la estructura de correlación y las propiedades de suavizado del modelo.
GP-MDP
Proceso de decisión de Markov donde las recompensas o transiciones son modeladas por procesos gaussianos, integrando la incertidumbre en la formulación del problema de RL.
Muestreo de Thompson con GP
Método de muestreo de acciones basado en extracciones del proceso gaussiano posterior, permitiendo la exploración guiada por la incertidumbre.
GP-SARSA
Variante del algoritmo SARSA que utiliza procesos gaussianos para modelar la función de valor Q con incertidumbre en el aprendizaje por refuerzo.
Kernel RBF
Función de base radial gaussiana utilizada como covarianza en los GP, asegurando la continuidad y diferenciabilidad de las funciones modeladas.
GPQ
Función Q aproximada por proceso gaussiano, permitiendo cuantificar la incertidumbre sobre las estimaciones de valor en el aprendizaje por refuerzo.
GP-PILCO
Framework de RL que utiliza procesos gaussianos para aprender la dinámica del sistema con propagación analítica de la incertidumbre.
Bandido Contextual con GP
Problema de bandido donde las recompensas dependen de un contexto, modelado por procesos gaussianos para capturar la incertidumbre espacial.
GP-MCTS
Búsqueda en Árbol Monte Carlo utilizando procesos gaussianos para evaluar los nodos con incertidumbre, mejorando la búsqueda en RL.
GP-MAE
Máximo a Posteriori con estimación de la incertidumbre mediante procesos gaussianos para la estimación de políticas en aprendizaje por refuerzo.