Методы компромисса
Многоцелевое формирование вознаграждения
Техника изменения векторной функции вознаграждения для ускорения обучения с сохранением оптимальности финальных многоцелевых политик.
← Назад