Aprendizagem por Reforço Multitarefa Offline
Cabeças de Política Específicas de Tarefa
Arquitetura de rede com tronco comum compartilhado e cabeças de saída distintas para cada tarefa no aprendizado offline multi-tarefas.
← Voltar