Алгоритмы UCB
Асимптотическая оптимальность
Теоретическое свойство, гарантирующее, что алгоритм UCB асимптотически достигает наименьшей возможной границы сожаления, характеризующее его долгосрочную эффективность.
← Назад