Offline Multi-Task Reinforcement Learning
Shared Dynamics Model
Modèle de transition unique appris à partir de données batch multi-tâches capturant les dynamiques communes et spécifiques des environnements.
← رجوع