Métodos Monte Carlo en RL
Algoritmo GLIE
Estrategia de exploración que es Greedy In the Limit with Infinite Exploration (Codiciosa en el Límite con Exploración Infinita), garantizando una convergencia asintótica hacia la política óptima. La exploración disminuye progresivamente mientras que la explotación aumenta con el tiempo.
← Volver