Многоцелевые функции ценности

📖

термины

Вектор многоп целевого значения состояния

Векторное представление, где каждая компонента соответствует оценочному значению состояния в соответствии с конкретной целью, позволяя одновременно оценивать множество критериев производительности.

📖

термины

Функция многоп целевого значения

Математическая функция, которая связывает каждую пару состояние-действие с вектором ожидаемых вознаграждений, захватывая компромиссы между различными противоречивыми целями.

📖

термины

Гиперплоскость Парето

Векторное подпространство в пространстве целей, определяющее границу между доминируемыми и недоминируемыми решениями, служащее ориентиром для многоп целевой оптимизации.

📖

термины

Фронт Парето

Набор эффективных решений, при котором улучшение одной цели невозможно без ухудшения хотя бы одной другой цели, представляющий многоп целевую оптимальность.

📖

термины

Оптимум Парето

Оптимальное состояние в многоп целевом контексте, при котором невозможно улучшить одну цель, не ухудшая хотя бы одну другую цель, характеризующее эффективные решения.

📖

термины

Оператор линейной агрегации

Математический оператор, который линейно объединяет значения различных целей, используя предопределенные веса для преобразования многоп целевой проблемы в скалярную.

📖

термины

Функция скаляризации

Математическое преобразование, которое преобразует вектор целей в единственное скалярное значение, облегчая сравнение и оптимизацию многоп целевых решений.

📖

термины

Многоцелевая дилемма исследования-эксплуатации

Сложная проблема, при которой баланс между обнаружением новых действий и использованием известных действий должен управляться одновременно для всех рассматриваемых целей.

📖

термины

Метод взвешивания

Техника многокритериальной оптимизации, назначающая относительные веса каждому критерию для направленного поиска к специфическим решениям на фронте Парето.

📖

термины

Многокритериальное равновесие Нэша

Концепция равновесия, расширенная на многокритериальные игры, где каждый агент оптимизирует вектор полезностей согласно своим предпочтениям, учитывая стратегии других.

📖

термины

Оператор Чебышёва

Функция агрегации, использующая норму Чебышёва для объединения критериев, которая отдает предпочтение оптимизации наихудшего критерия и гарантирует достижение любого решения Парето.

📖

термины

Многокритериальная стохастическая политика

Вероятностная стратегия принятия решений, где вероятности действий оптимизируются одновременно по нескольким критериям, позволяя гибкое управление компромиссами.

📖

термины

Многокритериальная матрица вознаграждения

Структура данных, хранящая векторные вознаграждения, связанные с каждым переходом состояние-действие, где каждое измерение соответствует конкретному критерию.

📖

термины

Декомпозиция функции ценности

Техника, заключающаяся в разложении векторной функции ценности на скалярные подфункции для облегчения обучения и многокритериальной оптимизации.

📖

термины

Лексикографический метод выбора

Подход оптимизации, упорядочивающий критерии по абсолютному приоритету, где оптимизация критерия учитывает только оптимальные решения для всех предыдущих критериев.

📖

термины

Иерархизация критериев

Процесс установления структуры приоритетов между различными критериями для направления оптимизации к решениям, соответствующим предпочтениям лица, принимающего решения.

📖

термины

Многокритериальная сходимость

Свойство алгоритма, обеспечивающее сходимость генерируемых решений к фронту Парето или подмножеству эффективных решений с течением итераций.

📖

термины

Многокритериальная стабильность

Способность алгоритма обучения поддерживать стабильную производительность по всем целям, несмотря на изменения в среде или возмущения.

Глоссарий ИИ

Вектор многоп целевого значения состояния

Функция многоп целевого значения

Гиперплоскость Парето

Фронт Парето

Оптимум Парето

Оператор линейной агрегации

Функция скаляризации

Многоцелевая дилемма исследования-эксплуатации

Метод взвешивания

Многокритериальное равновесие Нэша

Оператор Чебышёва

Многокритериальная стохастическая политика

Многокритериальная матрица вознаграждения

Декомпозиция функции ценности

Лексикографический метод выбора

Иерархизация критериев

Многокритериальная сходимость

Многокритериальная стабильность

Результаты не найдены