Многоцелевая эволюционная оптимизация
Политический градиент с множественными целями
Метод обучения с подкреплением, непосредственно оптимизирующий параметры политики для максимизации вектора многоцелевых вознаграждений с использованием техник стохастического градиента.
← Назад