Обучение с помощью Dyna-Q
Обобщение модели
Способность экстраполировать прогнозы модели на неизученные состояния-действия, часто реализуемая с помощью нейронных сетей или других аппроксиматоров функций.
← Назад