Apprentissage par Différentiation de Modèles
Differentiable Model-Based RL
Approche d'apprentissage par renforcement où les gradients sont rétropropagés à travers un modèle de l'environnement différentiable pour optimiser directement les politiques.
← 返回