Глоссарий ИИ
Полный словарь искусственного интеллекта
Линейное взвешивание
Метод скаляризации, в котором цели объединяются взвешенной суммой, где веса представляют относительную важность каждой цели согласно предпочтениям лица, принимающего решения.
Многоцелевое Q-обучение
Расширение традиционного Q-обучения, где каждое действие имеет вектор Q-значений вместо скалярного значения, требуя критериев выбора действия, специфичных для компромиссов.
Недоминируемая политика
Стратегия действий в пространстве политик, чьи показатели не превосходятся никакой другой политикой одновременно по всем целям, гарантируя оптимальность по Парето.
Гиперплоскость скаляризации
Техника, использующая гиперплоскость в пространстве целей для проецирования решений на скалярное измерение, позволяющая структурированное исследование компромиссов по предопределенным направлениям.
Скаляризация по Чебышеву
Метод скаляризации, основанный на взвешенном расстоянии Чебышева до опорной точки, гарантирующий получение Парето-оптимальных решений даже для невыпуклых задач.
Многоцелевое формирование вознаграждения
Техника изменения векторной функции вознаграждения для ускорения обучения с сохранением оптимальности финальных многоцелевых политик.
Динамический компромисс
Метод адаптации весов или предпочтений между целями во время обучения, позволяющий гибкое исследование пространства компромиссов в зависимости от эволюции среды.
Априорные предпочтения
Подход, при котором предпочтения лица, принимающего решения, указываются перед процессом оптимизации, направляя поиск на конкретные области фронта Парето.
Апостериорные предпочтения
Стратегия, которая сначала генерирует полный набор Парето-оптимальных решений, а затем позволяет лицу, принимающему решения, выбрать предпочтительное решение после визуализации и анализа.
Метод эталона
Техника, использующая эталонную точку в пространстве целей для направленного поиска решений, достигающих или превышающих желаемые уровни производительности.
Вектор утопии
Теоретическая точка в пространстве целей, одновременно оптимизирующая каждую отдельную цель, используемая в качестве эталона для оценки компромиссов в методах скаляризации.
Расстояние Чебышёва
Метрика, использующая максимум абсолютных различий между компонентами, особенно подходящая для измерения отклонений от целей в многокритериальной оптимизации.
Расширенная скаляризация
Расширение линейного взвешивания, добавляющее штрафной член на основе минимальных отклонений от целей, гарантирующее получение строго Парето-оптимальных решений.
Функция агрегации
Математическая операция, объединяющая несколько значений целей в одно скалярное значение, используемая в качестве критерия для оценки и сравнения решений в многомерном пространстве целей.
Политика компромисса
Стратегия действия, явно балансирующая противоречивые цели согласно определенным предпочтениям, часто реализуемая через адаптивные веса или динамические ограничения.
Равновесие Нэша в многокритериальных задачах
Концепция, расширяющая равновесие Нэша на многокритериальные контексты, где каждый агент оптимизирует собственный вектор целей в условиях взаимных ограничений равновесия.