Glosario IA
El diccionario completo de la Inteligencia Artificial
Distribución de Valor
Representación completa de la incertidumbre sobre los retornos futuros en el aprendizaje por refuerzo, modelando el conjunto de probabilidades de cada retorno posible en lugar de solo su esperanza.
Aprendizaje por Refuerzo Distribucional
Paradigma del AR que modela explícitamente la distribución completa de los retornos esperados para capturar la incertidumbre y variabilidad de los resultados futuros.
Función Q Distribucional
Extensión de la función Q-valor que devuelve una distribución de probabilidad sobre los retornos esperados en lugar de un valor escalar único.
Parametrización Atómica
Técnica de discretización de distribuciones continuas en conjuntos finitos de puntos (átomos) con probabilidades asociadas para facilitar el aprendizaje computacional.
Categorical Distributional RL (C51)
Algoritmo pionero que modela la distribución de retorno como una distribución categórica discreta sobre un soporte fijo de valores.
Operador de Bellman Distribucional
Generalización del operador de Bellman clásico que se aplica a distribuciones completas en lugar de solo a valores esperados.
Distancia de Wasserstein
Métrica utilizada para medir la similitud entre distribuciones de valor en el espacio de retornos, permitiendo capturar tanto la localización como la forma de las distribuciones.
Proyección Distribucional
Proceso de proyección de distribuciones continuas sobre un soporte discreto predefinido, esencial para la implementación práctica de los algoritmos distribucionales.
Riesgo Distribucional
Medida de la incertidumbre y variabilidad en las predicciones de retorno, cuantificada a través de los momentos estadísticos superiores de la distribución de valor.
Momentos de Orden Superior
Estadísticas (varianza, asimetría, curtosis) que describen la forma de la distribución de retorno más allá de la media, capturando asimetría y concentración de probabilidades.
Variación Temporal Distribucional
Evolución temporal de la forma completa de la distribución de retorno en lugar de solo su valor esperado, revelando patrones de riesgo cambiantes.
Soporte Discreto de Valor
Conjunto finito y ordenado de valores sobre el cual las distribuciones continuas son aproximadas en los algoritmos distribucionales prácticos.
Propagación Distribucional
Proceso de actualización de las distribuciones de valor a través del operador de Bellman, preservando la información sobre la incertidumbre en cada paso temporal.
Estabilidad Distribucional
Propiedad de convergencia de las distribuciones de valor hacia una forma estable durante el aprendizaje, garantizando la coherencia de las estimaciones de incertidumbre.