Непрерывное многоцелевое обучение с подкреплением
Непрерывная оптимизация Парето
Непрерывная оптимизация фронта Парето в процессе обучения, позволяющая агенту динамически адаптировать компромиссы между целями.
← Назад