Aprendizagem por Reforço Multitarefa Offline
Exploração-Explotação Offline Multi-Tarefa
Dilema adaptado ao contexto offline onde o equilíbrio entre o uso de dados existentes e a extrapolação controlada é gerenciado para múltiplas tarefas.
← Voltar