Reinforcement Learning Optimization
Reward Shaping
Technique consistant à modifier la fonction de récompense pour guider plus efficacement l'apprentissage de l'agent. Doit préserver l'optimalité tout en accélérant la convergence vers la solution souhaitée.
← Wstecz