Algoritmos UCB
UCB1-Tuned
Variante aprimorada do UCB1 que adapta dinamicamente os limites de confiança com base na variância observada das recompensas para otimizar a exploração.
← VoltarVariante aprimorada do UCB1 que adapta dinamicamente os limites de confiança com base na variância observada das recompensas para otimizar a exploração.
← Voltar