Многоцелевое обучение с подкреплением

📂

подкатегории

Взвешенная скаляризация

Метод, объединяющий цели путем линейного взвешивания для сведения многоцелевой задачи к одной цели

17 термины

📂

подкатегории

Фронт Парето

Множество оптимальных недоминируемых решений, в котором ни одна цель не может быть улучшена без ухудшения другой.

10 термины

📂

подкатегории

Обучение с подкреплением с ограничениями

Подход, оптимизирующий основную цель с соблюдением ограничений на другие цели.

20 термины

📂

подкатегории

Методы компромисса

Техники, явно балансирующие противоречивые цели в соответствии с определенными предпочтениями.

16 термины

📂

подкатегории

Многоцелевое Q-обучение

Расширение алгоритма Q-обучения, управляющее векторами вознаграждений вместо скалярных значений

11 термины

📂

подкатегории

Многоцелевая эволюционная оптимизация

Комбинация эволюционных алгоритмов с RL для исследования фронта Парето

9 термины

📂

подкатегории

Многоцелевое иерархическое обучение с подкреплением

Иерархическая структура, в которой разные уровни управляют разными целями или комбинациями целей.

11 термины

📂

подкатегории

Многоцелевые политики

Системы принятия решений, вырабатывающие оптимальные действия в соответствии с различными компромиссами между целями.

11 термины

📂

подкатегории

Многоцелевые функции ценности

Векторные представления ценности состояния или действия, учитывающие все цели одновременно.

18 термины

📂

подкатегории

Глубокое Многоцелевое РЛ

Применение глубоких нейронных сетей для аппроксимации сложных многоцелевых решений.

11 термины

📂

подкатегории

Исследование в пространстве целей

Стратегии исследования, разработанные для эффективного обнаружения фронта Парето

9 термины

📂

подкатегории

Многоагентное многоцелевое обучение с подкреплением

Расширение на многоагентный случай, где каждый агент или коллективная система оптимизирует несколько целей.

13 термины

📂

подкатегории

Оценка многокритериальных политик

Специфические метрики и методы для оценки и сравнения многокритериальных решений.

17 термины

📂

подкатегории

Динамическая адаптация весов

Методы автоматической настройки относительной важности целей в процессе обучения.

18 термины

📂

подкатегории

Непрерывное многоцелевое обучение с подкреплением

Применение к непрерывным пространствам действий с одновременной оптимизацией нескольких целей.

16 термины

Глоссарий ИИ

Взвешенная скаляризация

Фронт Парето

Обучение с подкреплением с ограничениями

Методы компромисса

Многоцелевое Q-обучение

Многоцелевая эволюционная оптимизация

Многоцелевое иерархическое обучение с подкреплением

Многоцелевые политики

Многоцелевые функции ценности

Глубокое Многоцелевое РЛ

Исследование в пространстве целей

Многоагентное многоцелевое обучение с подкреплением

Оценка многокритериальных политик

Динамическая адаптация весов

Непрерывное многоцелевое обучение с подкреплением

Результаты не найдены