Глоссарий ИИ
Полный словарь искусственного интеллекта
Теория Командных Игр
Теоретическая основа для кооперативного многопользовательского обучения, где агенты формируют команду для достижения общей цели, с механизмами совместного вознаграждения и неявной координации.
Распределение Заслуг (Credit Assignment)
Фундаментальная проблема в многопользовательском обучении, заключающаяся в правильном распределении вознаграждения или вины между каждым агентом за их соответствующий вклад в общий результат команды.
Многопользовательское Обучение через Подражание
Метод, при котором агенты обучаются, наблюдая и имитируя поведение других агентов (экспертов или коллег), используемый для ускорения обучения в сложных средах с дорогостоящим исследованием.
Федеративное Многопользовательское Обучение
Децентрализованный подход, при котором агенты обучают локальные модели на своих собственных данных и периодически обмениваются обновлениями параметров для построения глобальной модели без обмена исходными данными.
Смешанные Стратегии (Mixed Policies)
Стратегии в многопользовательском обучении, где каждый агент может применять смесь поведений (преследователь, избегающий, кооператор) с изменяющимися вероятностями в зависимости от состояния среды и действий других агентов.
Обучение с Частичным Наблюдением
Парадигма, при которой каждый агент имеет доступ только к части глобального состояния среды, требующая методов вывода и коммуникации для восстановления достаточного понимания для принятия решений.
Многопользовательские Графовые Нейронные Сети
Архитектура глубокого обучения, где агенты моделируются как узлы в динамическом графе, позволяющая изучать представления, которые захватывают отношения и зависимости между агентами.
Мета-игровое Обучение
Техника, при которой агенты учатся учиться, быстро адаптируясь к изменяющимся стратегиям других агентов, как в мета-игре, где способность к адаптации сама становится навыком для оптимизации.
Сходящаяся стабильность в многопользовательском обучении
Свойство, гарантирующее сходимость политик агентов к стабильному равновесию, несмотря на непрерывные взаимодействия, являющееся важным условием для надежности развернутых мультиагентных систем.