Glosario IA
El diccionario completo de la Inteligencia Artificial
Aproximación del Valor Esperado
Método tradicional en RL que se enfoca únicamente en la estimación de la esperanza matemática de los retornos futuros. Este enfoque ignora la varianza y los momentos superiores de la distribución de los retornos.
Ecuación de Bellman Distribucional
Generalización de la ecuación de Bellman que opera sobre distribuciones aleatorias en lugar de valores escalares. Describe cómo la distribución de los retornos se propaga a través de las transiciones de estados.
Política Sensible al Riesgo
Estrategia de acción que considera no solo la esperanza sino también la varianza u otras características de la distribución de los retornos. Estas políticas pueden ser aversas o buscadoras de riesgo según los objetivos.
Función de Distribución Acumulada
Función matemática que da la probabilidad de que una variable aleatoria tome un valor inferior o igual a un umbral dado. En RL distribucional, representa la distribución completa de los retornos acumulados.
Ajuste de Momentos
Técnica de aproximación que busca hacer coincidir los momentos estadísticos (media, varianza, etc.) de la distribución objetivo. A veces se utiliza para simplificar la representación de las distribuciones en RL.