Métodos Monte Carlo em RL
Algoritmo GLIE
Estratégia de exploração que é Gulosa no Limite com Exploração Infinita (GLIE), garantindo uma convergência assintótica para a política ótima. A exploração diminui progressivamente enquanto a exploração aumenta ao longo do tempo.
← Voltar