Глоссарий ИИ
Полный словарь искусственного интеллекта
Взвешенная скаляризация
Метод, объединяющий цели путем линейного взвешивания для сведения многоцелевой задачи к одной цели
Фронт Парето
Множество оптимальных недоминируемых решений, в котором ни одна цель не может быть улучшена без ухудшения другой.
Обучение с подкреплением с ограничениями
Подход, оптимизирующий основную цель с соблюдением ограничений на другие цели.
Методы компромисса
Техники, явно балансирующие противоречивые цели в соответствии с определенными предпочтениями.
Многоцелевое Q-обучение
Расширение алгоритма Q-обучения, управляющее векторами вознаграждений вместо скалярных значений
Многоцелевая эволюционная оптимизация
Комбинация эволюционных алгоритмов с RL для исследования фронта Парето
Многоцелевое иерархическое обучение с подкреплением
Иерархическая структура, в которой разные уровни управляют разными целями или комбинациями целей.
Многоцелевые политики
Системы принятия решений, вырабатывающие оптимальные действия в соответствии с различными компромиссами между целями.
Многоцелевые функции ценности
Векторные представления ценности состояния или действия, учитывающие все цели одновременно.
Глубокое Многоцелевое РЛ
Применение глубоких нейронных сетей для аппроксимации сложных многоцелевых решений.
Исследование в пространстве целей
Стратегии исследования, разработанные для эффективного обнаружения фронта Парето
Многоагентное многоцелевое обучение с подкреплением
Расширение на многоагентный случай, где каждый агент или коллективная система оптимизирует несколько целей.
Оценка многокритериальных политик
Специфические метрики и методы для оценки и сравнения многокритериальных решений.
Динамическая адаптация весов
Методы автоматической настройки относительной важности целей в процессе обучения.
Непрерывное многоцелевое обучение с подкреплением
Применение к непрерывным пространствам действий с одновременной оптимизацией нескольких целей.