Обучение с помощью Dyna-Q
Симулированный опыт
Искусственно сгенерированные выборки с помощью внутренней модели среды для ускорения обучения без необходимости дополнительного реального взаимодействия.
← Назад