Glosario IA
El diccionario completo de la Inteligencia Artificial
Función de Valor Multi-Objetivo
Extensión vectorial de la función de valor clásica que estima los retorno esperados para cada objetivo considerado separadamente. Permite la evaluación simultánea del rendimiento de una política según múltiples criterios.
Política de Equilibrio
Estrategia de decisión que mantiene un compromiso estable entre diferentes objetivos antagónicos a lo largo del tiempo. Representa una solución duradera en entornos donde los objetivos entran en conflicto.
Vector de Recompensa
Estructura de datos multidimensional que contiene los valores de recompensa para cada objetivo en cada paso de interacción. Constituye el elemento fundamental de retroalimentación en los sistemas MORL.
Frontera de Pareto
Conjunto completo de soluciones no dominadas que representan todos los compromisos óptimos posibles entre objetivos. Visualiza el espacio de soluciones candidatas en el aprendizaje por refuerzo multi-objetivo.
Política Estocástica Multi-Objetivos
Distribución de probabilidades sobre las acciones que optimiza simultáneamente múltiples objetivos según diferentes pesos. Permite la exploración de compromisos variados entre objetivos durante la toma de decisiones.
Hiperplano de Ponderación
Subespacio vectorial que define los pesos relativos asignados a cada objetivo en la escalarización. Determina la orientación de la optimización en el espacio multi-objetivos.
Espacios de Acción Multi-Objetivos
Estructuras donde cada acción puede tener impactos diferentes en cada objetivo considerado. Requieren algoritmos especializados para gestionar la complejidad de las decisiones multi-criterio.
Aprendizaje por Refuerzo Escalarizado
Paradigma que transforma el problema multi-objetivos en serie de problemas mono-objetivos mediante diferentes escalarizaciones. Permite el uso de algoritmos estándar para descubrir el conjunto de Pareto.
Optimización Convexa Multi-Objetivo
Clase de problemas donde las funciones objetivo son convexas, garantizando propiedades teóricas fuertes sobre las soluciones óptimas. Facilita la convergencia y el análisis de políticas multi-objetivo.
Métrica de Hipervolumen
Indicador de rendimiento que mide el volumen del espacio objetivo dominado por un conjunto de soluciones. Permite la comparación cuantitativa de conjuntos de políticas multi-objetivo.
Política Contextual Multi-Objetivo
Enfoque donde los pesos de los objetivos dependen del contexto o del estado del entorno. Permite una adaptación fina de los compromisos según las situaciones encontradas.