Обучение с помощью воображения
Исследование, управляемое моделью
Стратегия исследования, использующая прогнозы внутренней модели для выявления наиболее перспективных действий для попытки. Агент отдает приоритет симуляциям, ведущим к состояниям с высокой неопределенностью или высоким потенциалом вознаграждения.
← Назад