Глоссарий ИИ
Полный словарь искусственного интеллекта
Граф переходов состояний
Графическое представление, где узлы - это состояния среды, а ориентированные рёбра - возможные переходы между этими состояниями, часто взвешенные вероятностями.
Модель динамики на основе графа
Модель, которая кодирует динамику среды (функцию перехода и вознаграждения) непосредственно в структуре графа, позволяя симулировать траектории.
Граф причинно-следственных связей для RL
Ориентированный ациклический граф (DAG), который представляет причинно-следственные связи между переменными состояния, действиями и вознаграждениями, помогая понять влияние решений.
Сеть убеждений для планирования
Использование байесовской сети для моделирования неопределённостей среды, где планирование агента заключается в выводе наилучших действий для выполнения.
Граф отношений объектов
Граф, где узлы представляют объекты в среде, а рёбра описывают их пространственные или семантические отношения, используемый для более структурированного обучения.
Карта преемников на основе графа
Структура графа, которая для каждой пары состояние-действие хранит возможные состояния-преемники и их вероятности, формируя основу для планирования в моделях на основе графов.
Граф значений состояния
Граф, где узлы - это состояния, а вес каждого узла соответствует его оценочному значению (V(s)), позволяя визуализировать распространение значения в среде.
Модель мира в виде графа сцен
Представление среды как графа сцен, где каждый узел - это конфигурация объектов, а рёбра - возможные преобразования между этими конфигурациями.
Граф взаимозависимости переменных
Граф, который показывает, как различные переменные состояния влияют друг на друга при переходе, что необходимо для точного моделирования динамики.
Графическое дерево решений
Гибридная структура, объединяющая дерево решений для последовательностей действий с подграфами для представления сложных последствий каждого решения.
Граф навигации для агента
Абстрактный граф пространства состояний, где узлы - это регионы или точки интереса, а рёбра - это навигационные пути, упрощающий планирование высокого уровня.
Сеть информационных потоков для RL (обучения с подкреплением)
Ориентированный граф, моделирующий, как информация (например, о вознаграждениях или скрытых состояниях) распространяется во времени и пространстве состояний.
Граф политики
Представление стохастической политики π(a|s) в виде графа, где узлы - это состояния, а исходящие рёбра - это возможные действия с их вероятностями.
Факторная графическая модель для RL (обучения с подкреплением)
Модель, которая разлагает функцию перехода или вознаграждения в произведение локальных факторов, каждый из которых представлен подграфом, для повышения эффективности обучения.
Граф совместной встречаемости событий
Неориентированный граф, который захватывает вероятность того, что определённые события или переходы состояний происходят одновременно, помогая выявлять структурные паттерны.
Граф контрфактуального рассуждения
Граф, используемый для исследования гипотетических сценариев ('что, если') путем изменения узлов или рёбер для моделирования влияния альтернативных непринятых действий.
Граф иерархической декомпозиции задач
Ориентированный ациклический граф (DAG), в котором узлы представляют подзадачи, а рёбра определяют зависимости, структурируя решение сложных проблем в обучении с подкреплением (RL).