🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Мультиагентное Обратное Обучение с Подкреплением

Расширение IRL, где несколько агентов одновременно изучают функции вознаграждения на основе эксперта, демонстрирующего коллективное поведение в общих средах.

📖
термины

Коллективное Вознаграждение

Глобальная функция вознаграждения, разделяемая между всеми агентами системы, оптимизирующая производительность команды, а не индивидуальные выгоды.

📖
термины

Индивидуальное Вознаграждение

Функция вознаграждения, специфичная для каждого агента, учитывающая его личные действия, а также влияние на других агентов системы.

📖
термины

Кооперативная Игра

Мультиагентный сценарий, где все агенты разделяют общую цель и должны координировать свои действия для максимизации коллективного вознаграждения.

📖
термины

Конкурентная Игра

Среда, где агенты имеют противоречивые цели, каждый стремится максимизировать собственное вознаграждение в ущерб другим агентам.

📖
термины

Смешанная Игра

Мультиагентная конфигурация, сочетающая кооперативные и конкурентные элементы, где некоторые агенты могут формировать временные коалиции или стратегические оппозиции.

📖
термины

Согласование Предпочтений

Процесс гармонизации индивидуальных функций вознаграждения агентов для достижения согласованности с глобальными целями мультиагентной системы.

📖
термины

Мультиагентное Обучение на Демонстрациях

Техника, где агенты выводят вознаграждения из траекторий, демонстрируемых экспертами, работающими одновременно в среде.

📖
термины

Равновесие Нэша в IRL

Точка стратегической сходимости, в которой ни один агент не может улучшить своё вознаграждение, односторонне изменяя свою политику, учитывая политики других агентов.

📖
термины

Совместная функция ценности

Оценка ожидаемого совокупного вознаграждения для всех агентов, учитывающая их комбинированные состояния и действия в совместном пространстве состояний.

📖
термины

Командная политика

Скоординированная стратегия, определяющая оптимальные действия для каждого агента в зависимости от глобального состояния и коллективных намерений системы.

📖
термины

Декомпозиция вознаграждения

Метод разделения глобального вознаграждения на индивидуальные компоненты, приписываемые каждому агенту, при сохранении коллективной оптимальности.

📖
термины

Многопользовательское состязательное обучение

Фреймворк, в котором агенты-противники одновременно учатся выявлять и использовать слабости политик других агентов в контексте IRL.

📖
термины

Многоагентный консенсус

Процесс достижения соглашения между агентами относительно общей функции вознаграждения или разделяемых целей, необходимый для эффективного кооперативного обучения.

📖
термины

Неявная коммуникация

Передача информации между агентами через их действия и наблюдаемые состояния без прямого явного канала связи в среде IRL.

📖
термины

Федеративное обучение в IRL

Техника, позволяющая агентам изучать вознаграждения из распределённых данных без обмена их исходными данными, сохраняя конфиденциальность при сотрудничестве.

📖
термины

Теория Мультиагентных Игр

Теоретическая структура, анализирующая стратегические взаимодействия между рациональными агентами в средах обратного обучения с подкреплением.

📖
термины

Мультиагентное Передаваемое Обучение

Способность передавать знания о полученных наградах из одного мультиагентного контекста в другой, ускоряя адаптацию к новым средам.

🔍

Результаты не найдены