Deep RL Multi-Objetivos
PPO Multi-Objetivo
Adaptación del algoritmo Proximal Policy Optimization para entornos multi-objetivo, optimizando simultáneamente múltiples funciones objetivo. El algoritmo mantiene restricciones de proximidad mientras explora el espacio de compromisos entre objetivos.
← Volver