Глубинное обучение с подкреплением на основе модели
PlaNet
Алгоритм, изучающий модель динамики в компактном скрытом пространстве для решения задач непрерывного управления полностью через планирование, без явной политики.
← Назад