RL Multi-Objetivo Contínuo
Políticas Multi-Objetivo Estocásticas
Políticas probabilísticas em espaços de ação contínuos que otimizam simultaneamente múltiplos objetivos, frequentemente implementadas como distribuições gaussianas parametrizadas.
← Voltar