Методы Монте-Карло в RL
GLIE Algorithm
Stratégie d'exploration qui est Greedy In the Limit with Infinite Exploration, garantissant une convergence asymptotique vers la politique optimale. L'exploration décroît progressivement tandis que l'exploitation augmente au fil du temps.
← Назад