Algoritmos Epsilon-Voraces
Convergencia del algoritmo
Propiedad que garantiza que el algoritmo épsilon-greedy converge hacia la política óptima bajo ciertas condiciones. La convergencia depende del decaimiento apropiado de épsilon y del número suficiente de iteraciones.
← Volver