Методы компромисса
Многоцелевое Q-обучение
Расширение традиционного Q-обучения, где каждое действие имеет вектор Q-значений вместо скалярного значения, требуя критериев выбора действия, специфичных для компромиссов.
← Назад