Глубокий Детерминированный Градиент Политики (DDPG)
Сеть актора (Actor Network)
Нейронная сеть, которая учится напрямую отображать состояния на оптимальные действия в непрерывном пространстве действий.
← Назад