Методы Актор-Критик
Value Function
Fonction mathématique estimant le retour cumulé attendu depuis un état ou une paire état-action, servant de signal d'apprentissage pour le critique dans l'architecture Actor-Critic.
← Назад