RL Multi-Objectifs Continu
Continuous Action Space RL
Paradigme d'apprentissage par renforcement où l'agent peut choisir parmi une infinité d'actions continues, nécessitant des algorithmes d'optimisation adaptés comme PPO ou SAC.
← Retour