Планирование с помощью обучения с подкреплением
Непрерывное планирование с помощью обучения с подкреплением (Continuous RL Planning)
Специализация обучения с подкреплением для задач планирования, где пространства состояний и действий непрерывны, требуя специфических техник аппроксимации, таких как актор-критик.
← Назад