Непрерывное многоцелевое обучение с подкреплением
Стохастические многоцелевые политики
Вероятностные политики в непрерывных пространствах действий, оптимизирующие одновременно несколько целей, часто реализуемые как параметризованные гауссовы распределения.
← Назад