Глубинное обучение с подкреплением на основе модели
Архитектура Dyna
Фреймворк, интегрирующий прямое и непрямое обучение с подкреплением, где симулированные опыты, сгенерированные моделью, дополняют реальные данные для ускорения обучения.
← Назад