Глоссарий ИИ
Полный словарь искусственного интеллекта
Многошаговое предсказание траектории
Техника, заключающаяся в предвосхищении непрерывной последовательности будущих состояний на несколько временных шагов для оценки долгосрочных последствий действия перед его фактическим выполнением.
Дерево поиска Монте-Карло
Алгоритм древовидного поиска, использующий случайные симуляции для оценки возможных будущих траекторий из данного состояния, оптимизируя выбор действий.
Планирование с предвидением
Процесс последовательной оценки будущих действий с использованием изученной модели для выбора оптимальной политики перед любым взаимодействием с реальной средой.
Модель динамики окружающей среды
Нейронная сеть, обученная захватывать физические правила и изменения состояния среды для точного предсказания последствий действий агента.
Моделирование воображения
Способность системы мысленно генерировать альтернативные сценарии и траектории, используя свою внутреннюю модель окружающей среды без физического взаимодействия.
Предварительная симуляция
Полная симуляция последовательности действий из начального состояния с использованием изученной модели для оценки ожидаемой совокупной награды.
Обучение через виртуальные пробы
Парадигма, в которой агент улучшается в основном через симулированный опыт в своей внутренней модели, а не через прямые взаимодействия со средой.
Генеративная модель траекторий
Архитектура глубокого обучения, генерирующая распределения возможных траекторий вместо детерминистического предсказания, отражающая стохастический характер окружающей среды.
Исследование через моделирование
Стратегия исследования, при которой агент открывает новые политики, массово симулируя сценарии в своей модели перед тестированием наиболее перспективных в реальности.
Предсказание состояние-действие
Модель, непосредственно предсказывающая следующее состояние s(t+1) на основе текущего состояния s(t) и действия a(t), формируя основное уравнение перехода.
Буфер воображаемого опыта
Структура данных, хранящая смоделированные траектории, сгенерированные моделью для обучения, дополняя реальный опыт, собранный в среде.
Обучение глобальной модели
Подход, при котором одна модель обучается полной динамике среды, разделяется между всеми задачами и политиками для лучшей генерализации.
Сеть прогнозирования траектории
Нейронная архитектура, специализированная на предсказании последовательностей будущих состояний, часто основанная на РНН или трансформерах для захвата временных зависимостей.
Валидация модели
Систематический процесс оценки предсказательной точности модели на отложенных данных для обеспечения надежности смоделированных траекторий.
Генерация контрфактуалов
Техника создания гипотетических альтернативных траекторий для понимания воздействия различных решений и улучшения каузального понимания модели.