Офлайн многозадачное обучение с подкреплением
Факторизация многозадачной офлайн-функции ценности
Разложение функции ценности на общие и специфичные для задач компоненты для улучшения многозадачного офлайн-обучения.
← Назад