Algorithmes UCB
Asymptotic Optimality
Propriété théorique garantissant qu'un algorithme UCB atteint asymptotiquement la plus faible borne de regret possible, caractérisant son efficacité à long terme.
← Retour