Многорукие бандиты
Скорость Сходимости
Скорость, с которой алгоритм приближается к оптимальной политике, измеряющая асимптотическую эффективность стратегии обучения.
← НазадСкорость, с которой алгоритм приближается к оптимальной политике, измеряющая асимптотическую эффективность стратегии обучения.
← Назад