Глоссарий ИИ
Полный словарь искусственного интеллекта
Модели динамики окружающей среды
Обучение математических моделей, описывающих, как окружающая среда изменяется в зависимости от действий агента.
Обучение на основе Мировых Моделей (World Models)
Архитектура, в которой агент строит внутреннее представление мира для симуляции и планирования своих будущих действий.
Планирование с помощью поиска по дереву Монте-Карло
Использование алгоритмов поиска по дереву в сочетании с обученными моделями для нахождения оптимальных стратегий.
Вероятностные и байесовские модели
Подходы, интегрирующие неопределенность в моделирование окружающей среды для принятия устойчивых решений.
Обучение с помощью воображения и мечты
Техники, при которых агент тренируется на мысленно смоделированных сценариях перед действиями в реальности.
Вариационные модели
Использование вариационных автоэнкодеров для изучения латентных представлений окружающей среды.
Обучение с переносом с использованием моделей
Перенос знаний между средами с использованием изученных моделей в качестве посредников.
Графические модели для RL
Представление среды в виде графов для захвата структурных отношений
Иерархическое обучение с подкреплением на основе моделей
Иерархическая декомпозиция задач с моделями на разных уровнях временной абстракции
Непрерывные и дифференцируемые модели
Моделирование непрерывной динамики, где модель остается дифференцируемой для оптимизации.
Калибровка неопределенности и исследование
Техники для количественной оценки и управления неопределенностью модели с целью оптимизации исследования.
Обучение с обратным подкреплением на основе моделей
Вывод функций вознаграждения с использованием моделей для генерации правдоподобных траекторий