Trajectory Transformer
Sequence Modeling
Approche qui formalise l'apprentissage par renforcement comme un problème de modélisation de séquences, où les états, actions et récompenses sont traités comme des tokens dans une séquence temporelle.
← Retour