UCB Algorithms
UCB-V
Algorithme UCB utilisant explicitement les estimations de variance pour construire des bornes de confiance plus précises, particulièrement efficace avec des récompenses à forte variance.
← Indietro