Глоссарий ИИ
Полный словарь искусственного интеллекта
Вектор многоп целевого значения состояния
Векторное представление, где каждая компонента соответствует оценочному значению состояния в соответствии с конкретной целью, позволяя одновременно оценивать множество критериев производительности.
Функция многоп целевого значения
Математическая функция, которая связывает каждую пару состояние-действие с вектором ожидаемых вознаграждений, захватывая компромиссы между различными противоречивыми целями.
Гиперплоскость Парето
Векторное подпространство в пространстве целей, определяющее границу между доминируемыми и недоминируемыми решениями, служащее ориентиром для многоп целевой оптимизации.
Фронт Парето
Набор эффективных решений, при котором улучшение одной цели невозможно без ухудшения хотя бы одной другой цели, представляющий многоп целевую оптимальность.
Оптимум Парето
Оптимальное состояние в многоп целевом контексте, при котором невозможно улучшить одну цель, не ухудшая хотя бы одну другую цель, характеризующее эффективные решения.
Оператор линейной агрегации
Математический оператор, который линейно объединяет значения различных целей, используя предопределенные веса для преобразования многоп целевой проблемы в скалярную.
Функция скаляризации
Математическое преобразование, которое преобразует вектор целей в единственное скалярное значение, облегчая сравнение и оптимизацию многоп целевых решений.
Многоцелевая дилемма исследования-эксплуатации
Сложная проблема, при которой баланс между обнаружением новых действий и использованием известных действий должен управляться одновременно для всех рассматриваемых целей.
Метод взвешивания
Техника многокритериальной оптимизации, назначающая относительные веса каждому критерию для направленного поиска к специфическим решениям на фронте Парето.
Многокритериальное равновесие Нэша
Концепция равновесия, расширенная на многокритериальные игры, где каждый агент оптимизирует вектор полезностей согласно своим предпочтениям, учитывая стратегии других.
Оператор Чебышёва
Функция агрегации, использующая норму Чебышёва для объединения критериев, которая отдает предпочтение оптимизации наихудшего критерия и гарантирует достижение любого решения Парето.
Многокритериальная стохастическая политика
Вероятностная стратегия принятия решений, где вероятности действий оптимизируются одновременно по нескольким критериям, позволяя гибкое управление компромиссами.
Многокритериальная матрица вознаграждения
Структура данных, хранящая векторные вознаграждения, связанные с каждым переходом состояние-действие, где каждое измерение соответствует конкретному критерию.
Декомпозиция функции ценности
Техника, заключающаяся в разложении векторной функции ценности на скалярные подфункции для облегчения обучения и многокритериальной оптимизации.
Лексикографический метод выбора
Подход оптимизации, упорядочивающий критерии по абсолютному приоритету, где оптимизация критерия учитывает только оптимальные решения для всех предыдущих критериев.
Иерархизация критериев
Процесс установления структуры приоритетов между различными критериями для направления оптимизации к решениям, соответствующим предпочтениям лица, принимающего решения.
Многокритериальная сходимость
Свойство алгоритма, обеспечивающее сходимость генерируемых решений к фронту Парето или подмножеству эффективных решений с течением итераций.
Многокритериальная стабильность
Способность алгоритма обучения поддерживать стабильную производительность по всем целям, несмотря на изменения в среде или возмущения.