Методы градиента политики
Градиент детерминированной политики
Расширение градиента политики на непрерывные пространства действий, где политика детерминирована, особенно эффективно в средах с высокой размерностью.
← Назад