Glosario IA
El diccionario completo de la Inteligencia Artificial
Procesos de Decisión de Markov Estocásticos
MDP donde las transiciones y recompensas siguen distribuciones probabilísticas, modelando la incertidumbre ambiental.
Métodos Monte Carlo en RL
Algoritmos que utilizan muestreo aleatorio repetido para estimar los valores de estado-acción en entornos estocásticos.
Políticas Estocásticas
Estrategias que devuelven distribuciones de probabilidad sobre las acciones en lugar de acciones deterministas.
Aprendizaje por Refuerzo Bayesiano
Enfoque que aborda la incertidumbre sobre los parámetros del modelo utilizando distribuciones de probabilidad.
Bandidos Estocásticos Multi-brazos
Problema de exploración-explotación donde cada brazo tiene una distribución de recompensa estocástica desconocida.
Métodos Bootstrap en RL
Técnicas que utilizan el remuestreo para cuantificar la incertidumbre en las estimaciones de valor.
Procesos Gaussianos para RL
Uso de procesos gaussianos para modelar la incertidumbre en la función de valor o de transición.
Métodos de Conjunto en RL Estocástico
Combinación de múltiples estimadores para capturar la incertidumbre epistémica en el aprendizaje.
Aprendizaje por Refuerzo Distribucional
Aprendizaje de la distribución completa de los retornos en lugar de solo su esperanza matemática.
Regresión Cuantil DRL
Enfoque específico del RL distribucional utilizando la regresión cuantil para modelar la incertidumbre.
MDP Parcialmente Observables Estocásticos
Extensión de los MDP estocásticos con observación parcial, aumentando la incertidumbre sobre el estado.
Optimización Estocástica en RL
Métodos de optimización que consideran el ruido y la incertidumbre en los gradientes y las actualizaciones.