Глубинное обучение с подкреплением
Глубокий детерминированный градиент стратегии (DDPG)
Алгоритм off-policy для непрерывных пространств действий, объединяющий DQN и Actor-Critic, использующий целевые сети и детерминированную стратегию.
← Назад