RL Multi-Objetivo Contínuo
Otimização Contínua de Pareto
Otimização contínua da frente de Pareto durante o aprendizado, permitindo ao agente adaptar dinamicamente seus compromissos entre objetivos.
← Voltar