Offline Multi-Task Reinforcement Learning
Multi-Task Distributional RL
Framework modélisant la distribution complète des retours plutôt que leur espérance pour chaque tâche dans un contexte offline multi-tâches.
← Volver