Глоссарий ИИ
Полный словарь искусственного интеллекта
Совместное использование параметров
Техника масштабируемости, при которой несколько агентов используют одни и те же параметры нейронной сети, снижая вычислительную сложность и способствуя кооперативному обучению.
Графовые нейронные сети для MARL
Архитектура сетей, адаптированная для многoагентных структур, где узлы представляют агентов, а ребра - их отношения, обеспечивая эффективную коммуникацию в больших масштабах.
Многoагентное кураторское обучение
Стратегия постепенного обучения, где сложность задач и количество агентов постепенно увеличиваются, улучшая стабильность обучения в больших масштабах.
Иерархический MARL
Организационная структура, где агенты организованы в иерархии, позволяющая управлять сложными системами с тысячами агентов через декомпозицию ответственности.
Изученные протоколы коммуникации
Механизмы, при которых агенты автоматически разрабатывают оптимизированные протоколы коммуникации для минимизации пропускной способности при максимизации эффективной координации.
Многoагентные механизмы внимания
Техника, позволяющая агентам выборочно фокусироваться на наиболее релевантной информации среди тысяч других агентов, снижая вычислительную сложность.
Популяционное обучение для MARL
Эволюционный метод оптимизации, где популяция многoагентных политик развивается параллельно, обеспечивая эффективное исследование пространства кооперативных стратегий.
Алгоритм QMIX
Алгоритм многoагентного Q-обучения, гарантирующий монотонность между индивидуальными и совместными значениями, обеспечивая стабильное обучение в системах большого размера.
Моделирование оппонента
Способность агентов моделировать и предсказывать поведение других агентов, необходимая для эффективной координации в масштабируемых мультиагентных системах.
Эмерджентная коммуникация
Феномен, при котором агенты спонтанно развивают структурированные системы коммуникации для коллективного решения сложных проблем в больших масштабах.
Сети моделирования агентов
Специализированные нейронные сети для изучения ментальных моделей других агентов, критически важные для прогнозирования и координации в массово мультиагентных системах.
Распределенные MARL-фреймворки
Программные инфраструктуры, позволяющие параллелизировать мультиагентное обучение на вычислительных кластерах, необходимые для управления миллионами агентов одновременно.
Масштабируемая оптимизация политик
Набор алгоритмических техник, оптимизирующих временную и пространственную сложность оптимизации политик для систем с миллионами параметров и агентов.
Алгоритмы роевого интеллекта
Биовдохновленные подходы, где простые агенты следуют локальным правилам для возникновения коллективного интеллектуального поведения, применимые к системам очень большого масштаба.
Мультиагентное распределение заслуг
Фундаментальная проблема правильного распределения наград и штрафов между индивидуальными агентами в крупной кооперативной системе.