Глоссарий ИИ
Полный словарь искусственного интеллекта
Мультиагентное Обратное Обучение с Подкреплением
Расширение IRL, где несколько агентов одновременно изучают функции вознаграждения на основе эксперта, демонстрирующего коллективное поведение в общих средах.
Коллективное Вознаграждение
Глобальная функция вознаграждения, разделяемая между всеми агентами системы, оптимизирующая производительность команды, а не индивидуальные выгоды.
Индивидуальное Вознаграждение
Функция вознаграждения, специфичная для каждого агента, учитывающая его личные действия, а также влияние на других агентов системы.
Кооперативная Игра
Мультиагентный сценарий, где все агенты разделяют общую цель и должны координировать свои действия для максимизации коллективного вознаграждения.
Конкурентная Игра
Среда, где агенты имеют противоречивые цели, каждый стремится максимизировать собственное вознаграждение в ущерб другим агентам.
Смешанная Игра
Мультиагентная конфигурация, сочетающая кооперативные и конкурентные элементы, где некоторые агенты могут формировать временные коалиции или стратегические оппозиции.
Согласование Предпочтений
Процесс гармонизации индивидуальных функций вознаграждения агентов для достижения согласованности с глобальными целями мультиагентной системы.
Мультиагентное Обучение на Демонстрациях
Техника, где агенты выводят вознаграждения из траекторий, демонстрируемых экспертами, работающими одновременно в среде.
Равновесие Нэша в IRL
Точка стратегической сходимости, в которой ни один агент не может улучшить своё вознаграждение, односторонне изменяя свою политику, учитывая политики других агентов.
Совместная функция ценности
Оценка ожидаемого совокупного вознаграждения для всех агентов, учитывающая их комбинированные состояния и действия в совместном пространстве состояний.
Командная политика
Скоординированная стратегия, определяющая оптимальные действия для каждого агента в зависимости от глобального состояния и коллективных намерений системы.
Декомпозиция вознаграждения
Метод разделения глобального вознаграждения на индивидуальные компоненты, приписываемые каждому агенту, при сохранении коллективной оптимальности.
Многопользовательское состязательное обучение
Фреймворк, в котором агенты-противники одновременно учатся выявлять и использовать слабости политик других агентов в контексте IRL.
Многоагентный консенсус
Процесс достижения соглашения между агентами относительно общей функции вознаграждения или разделяемых целей, необходимый для эффективного кооперативного обучения.
Неявная коммуникация
Передача информации между агентами через их действия и наблюдаемые состояния без прямого явного канала связи в среде IRL.
Федеративное обучение в IRL
Техника, позволяющая агентам изучать вознаграждения из распределённых данных без обмена их исходными данными, сохраняя конфиденциальность при сотрудничестве.
Теория Мультиагентных Игр
Теоретическая структура, анализирующая стратегические взаимодействия между рациональными агентами в средах обратного обучения с подкреплением.
Мультиагентное Передаваемое Обучение
Способность передавать знания о полученных наградах из одного мультиагентного контекста в другой, ускоряя адаптацию к новым средам.