Glosario IA
El diccionario completo de la Inteligencia Artificial
Distribución por Cuantiles Continos
Representación de la distribución de retorno como un conjunto de cuantiles evolutivos en los espacios de acción continuos, permitiendo una modelización fina de la incertidumbre y los riesgos.
Proyección Cramer-Wold Distributional
Técnica matemática que permite comparar distribuciones proyectando sobre direcciones unidimensionales, esencial para las métricas distributionales en RL continuo.
Red de Distribución Atómica
Arquitectura neuronal que representa una distribución como un conjunto ponderado de átomos fijos, adaptada a problemas de acción continua con retorno estocástico.
Riesgo Distributional en Continuo
Medida que cuantifica la incertidumbre en las distribuciones de retorno de los espacios de acción continuos, crucial para la evaluación de políticas robustas.
Política Estocástica Distributional
Estrategia de acción que integra directamente la distribución de retorno en la selección de acciones continuas, optimizando sobre todo el conjunto de la distribución más que sobre la expectativa sola.
Expectativa de Distribución Cuantil
Operador que calcula la expectativa a partir de la representación por cuantiles, preservando las propiedades distributionales en los espacios continuos.
Muestreo por Rechazo Distributional
Método de muestreo que preserva las propiedades distributionales durante la generación de acciones continuas a partir de distribuciones de retorno complejas.
Optimización Distributional Estocástica
Paradigma de optimización que trabaja directamente sobre las distribuciones de retornos más que sobre sus estimaciones puntuales en los espacios continuos.
Aproximación por Núcleos Distribucionales
Técnica que utiliza funciones núcleo para aproximar distribuciones de retorno en espacios de acción continuos de alta dimensión.
Distancia de Wasserstein en RL Continuo
Métrica que mide la disimilaridad entre distribuciones de retorno, particularmente adaptada a problemas de acción continua con geometría compleja.
Muestreo de Importancia Distribucional
Técnica de muestreo ponderado que preserva las características distribucionales durante la estimación de gradientes políticos en continuo.
Actualización Distribucional por Monte-Carlo
Algoritmo que actualiza las distribuciones de retorno utilizando muestras Monte-Carlo en espacios de acción continuos, preservando la forma distribucional.
Reducción de Varianza Distribucional
Conjunto de técnicas que buscan reducir la varianza en las estimaciones distribucionales sin perder información sobre la forma de las distribuciones.
Política Greedy Distribucional
Estrategia que selecciona acciones óptimas según un criterio sobre la distribución completa (ej: cuantil, CVaR) en lugar de solo según la esperanza en continuo.
Ecuación de Bellman Distribucional
Formulación de la ecuación de Bellman que opera sobre distribuciones completas en lugar de valores escalares, fundamental para el RL distribucional continuo.
Crítico Distribucional en Continuo
Red neuronal que estima la distribución completa de retornos para estados-acciones continuos, reemplazando al crítico tradicional de valor escalar.
Sesgo Distribucional en Acción Continua
Fenómeno donde las aproximaciones distribucionales introducen sesgos sistemáticos en la estimación de los retornos en espacios de acción continuos.
Normalización Distribucional Continua
Técnica de normalización que preserva las propiedades distribucionales durante el procesamiento de acciones continuas a diferentes escalas.
Exploración Distribucional Adaptativa
Estrategia de exploración que utiliza la información completa de la distribución de retorno para adaptar el comportamiento exploratorio en acción continua.