Aprendizagem por Reforço Multitarefa Offline
Aprendizagem Multi-Tarefa em Lote
Abordagem onde o agente aprende a resolver múltiplas tarefas usando apenas dados pré-coletados, sem exploração online durante o treinamento.
← Voltar