Model-Based Offline RL
Trajectory Transformers
Architecture transformer qui modélise les trajectoires comme des séquences d'états, actions et récompenses pour prédire les transitions futures en apprentissage offline.
← Volver