🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Многопользовательское обучение с подкреплением

Парадигма обучения, в которой несколько агентов одновременно учатся принимать решения в общей среде, взаимодействуя друг с другом для оптимизации коллективных или индивидуальных целей.

📖
термины

Многопользовательский глубокий детерминированный градиент политики (MADDPG)

Алгоритм CTDE, расширяющий DDPG для многопользовательских сред, использующий централизованные критические сети и децентрализованные акторы для обучения в непрерывных пространствах действий.

📖
термины

Многопользовательский частично наблюдаемый марковский процесс принятия решений (MPOMDP)

Математическая формализация сред MARL, где каждый агент имеет частичные наблюдения и должен выводить глобальное состояние для принятия оптимальных решений.

📖
термины

Игры среднего поля

Теория, изучающая взаимодействия большого количества рациональных агентов путем аппроксимации эффекта толпы средним полем, применимая к крупномасштабным многопользовательским системам.

📖
термины

Непрерывное управление

Область применения MARL, где агенты должны управлять физическими системами с непрерывными действиями, такими как мобильная робототехника или манипуляция объектами.

📖
термины

Стохастические игры

Расширение MDP для многопользовательских сред, где переходы и награды зависят от совместных действий всех агентов, моделирующих кооперативные и соревновательные сценарии.

📖
термины

Равновесие Нэша в MARL

Концепция стабильности, где ни один агент не может улучшить свою награду, односторонне изменив свою стратегию, используемая как критерий сходимости в соревновательных алгоритмах MARL.

📖
термины

Протоколы координации

Механизмы коммуникации или синхронизации, позволяющие агентам согласовывать свои действия для достижения коллективных целей в непрерывных средах MARL.

🔍

Результаты не найдены