Непрерывное многоцелевое обучение с подкреплением
Динамическое взвешивание
Адаптивная стратегия, изменяющая веса целей в процессе обучения для эффективного исследования фронта Парето и избежания локальных оптимумов.
← Назад