Непрерывные и дифференцируемые модели
Оптимизация с использованием дифференцируемого расширенного лагранжиана
Метод оптимизации с ограничениями, где функция расширенного лагранжиана дифференцируема по переменным состояния и управления, что позволяет использовать ее в циклах обучения с подкреплением.
← Назад