Aprendizagem por Reforço Multitarefa Offline
Aprendizagem de Representação Agnostic à Tarefa
Processo de aprendizagem de representações de estado-ação generalizáveis a partir de dados em lote sem conhecimento específico de tarefas futuras.
← Voltar