Algoritmos UCB
UCB1-Tuned
Variante mejorada de UCB1 que adapta dinámicamente los límites de confianza en función de la varianza observada de las recompensas para optimizar la exploración.
← Volver