Offline Multi-Task Reinforcement Learning
Multi-Task Offline Data Efficiency
Mesure de l'efficacité avec laquelle les données batch sont utilisées pour apprendre multiples politiques par rapport à l'apprentissage mono-tâche.
← Volver