Глоссарий ИИ

Полный словарь искусственного интеллекта

235

категории

2 988

подкатегории

33 628

термины

📖

термины

Многопользовательское обучение с подкреплением

Парадигма обучения, в которой несколько агентов одновременно учатся принимать решения в общей среде, взаимодействуя друг с другом для оптимизации коллективных или индивидуальных целей.

📖

термины

Многопользовательский глубокий детерминированный градиент политики (MADDPG)

Алгоритм CTDE, расширяющий DDPG для многопользовательских сред, использующий централизованные критические сети и децентрализованные акторы для обучения в непрерывных пространствах действий.

📖

термины

Многопользовательский частично наблюдаемый марковский процесс принятия решений (MPOMDP)

Математическая формализация сред MARL, где каждый агент имеет частичные наблюдения и должен выводить глобальное состояние для принятия оптимальных решений.

📖

термины

Игры среднего поля

Теория, изучающая взаимодействия большого количества рациональных агентов путем аппроксимации эффекта толпы средним полем, применимая к крупномасштабным многопользовательским системам.

📖

термины

Непрерывное управление

Область применения MARL, где агенты должны управлять физическими системами с непрерывными действиями, такими как мобильная робототехника или манипуляция объектами.

📖

термины

Стохастические игры

Расширение MDP для многопользовательских сред, где переходы и награды зависят от совместных действий всех агентов, моделирующих кооперативные и соревновательные сценарии.

📖

термины

Равновесие Нэша в MARL

Концепция стабильности, где ни один агент не может улучшить свою награду, односторонне изменив свою стратегию, используемая как критерий сходимости в соревновательных алгоритмах MARL.

📖

термины

Протоколы координации

Механизмы коммуникации или синхронизации, позволяющие агентам согласовывать свои действия для достижения коллективных целей в непрерывных средах MARL.

🔍

Глоссарий ИИ

Многопользовательское обучение с подкреплением

Многопользовательский глубокий детерминированный градиент политики (MADDPG)

Многопользовательский частично наблюдаемый марковский процесс принятия решений (MPOMDP)

Игры среднего поля

Непрерывное управление

Стохастические игры

Равновесие Нэша в MARL

Протоколы координации

Результаты не найдены