Bandidos Contextuales
LinUCB
Algoritmo de bandido contextual que utiliza regresión lineal con un límite de confianza superior (Upper Confidence Bound) para equilibrar exploración y explotación en espacios de contexto continuos.
← Volver