Глоссарий ИИ
Полный словарь искусственного интеллекта
POMDP (Частично наблюдаемый марковский процесс принятия решений)
Формальная математическая структура, моделирующая среды, где агент воспринимает лишь частичное наблюдение реального состояния системы.
Состояния Убеждений
Вероятностное представление возможных состояний системы, основанное на истории наблюдений и действий агента.
Фильтры частиц
Метод последовательной оценки, использующий взвешенные выборки для аппроксимации распределения вероятностей в POMDP.
Q-learning с частичной наблюдаемостью
Расширение алгоритма Q-learning, адаптированное для сред, где полные состояния не наблюдаются напрямую.
Рекуррентные нейронные сети для POMDP
Нейронная архитектура, использующая внутренние памяти для сохранения исторической информации, необходимой для принятия решений.
Исследование в POMDP
Стратегии исследования, специально разработанные для управления неопределенностью состояния в частично наблюдаемых средах.
Иерархическое обучение с подкреплением для POMDP
Подход, разлагающий сложные проблемы POMDP на иерархические подзадачи для повышения эффективности обучения.
Модели на основе памяти
Системы, использующие внешние явные памяти для хранения и извлечения релевантной исторической информации.
Частично наблюдаемое многопользовательское обучение
Расширение POMDP на сценарии с участием нескольких агентов, взаимодействующих в частично наблюдаемой среде.
Аппроксимация политик для POMDP
Методы аппроксимации, позволяющие вычислять оптимальные или квазиоптимальные политики в пространствах состояний веры большой размерности.
Deep POMDP
Комбинация глубокого обучения с POMDP для управления сложными и высокоразмерными средами.
Трансформеры для POMDP
Применение архитектур трансформеров для моделирования длительных временных зависимостей в частично наблюдаемых средах.