Алгоритмы UCB
Деревья верхнего доверия (UCT)
Применение принципа UCB к деревьям поиска для последовательного принятия решений, основа многих игровых алгоритмов, таких как AlphaGo, использующих поиск по дереву Монте-Карло.
← Назад