Combinatorial Bandits
Méthode CUCB
Adaptation de l'algorithme UCB au cadre combinatoire, utilisant un oracle pour trouver le sous-ensemble optimal d'actions basé sur les bornes supérieures de confiance individuelles.
← Zurück