Глоссарий ИИ
Полный словарь искусственного интеллекта
Дифференцируемое обучение с подкреплением на основе модели
Подход обучения с подкреплением, где градиенты обратного распространения ошибки проходят через дифференцируемую модель среды для прямой оптимизации стратегий.
Модели динамики на основе нейронных сетей
Нейронные сети, обученные предсказывать эволюцию состояний среды в зависимости от действий, обеспечивая дифференцируемое моделирование.
Дифференцируемая оптимизация
Техника, в которой слои оптимизации являются дифференцируемыми, что позволяет сквозное обучение вложенных процессов оптимизации.
Воспроизведение воображаемого опыта
Генерация синтетических траекторий с помощью дифференцируемой модели для обогащения обучающего опыта без реального взаимодействия.
Дифференцируемое планирование
Алгоритмы планирования, где каждый шаг является дифференцируемым, что позволяет непрерывную оптимизацию планов с помощью градиентного спуска.
Дифференцируемый симулятор
Среда моделирования, реализованная с помощью дифференцируемых операций, позволяющая вычисление градиентов через всю симуляцию.
Градиент стратегии через модель
Метод вычисления градиентов стратегии путем распространения вознаграждений через дифференцируемую модель среды.
Дифференцируемые модели среды
Модели среды, специально разработанные для поддержки обратного распространения градиентов через их внутренние операции.
Дифференцируемые игровые движки
Модифицированные игровые движки, поддерживающие дифференцирование, позволяющие обучение с подкреплением в сложных средах.
Нейронные ОДУ в ОСП
Использование нейронных обыкновенных дифференциальных уравнений для моделирования непрерывной динамики среды дифференцируемым образом.
Дифференцируемая теория управления
Применение принципов теоретического управления, реализованных дифференцируемым образом, для сквозного обучения контроллеров.