Офлайн многозадачное обучение с подкреплением
Многозадачное офлайн-исследование-использование
Дилемма, адаптированная к офлайн-контексту, где баланс между использованием существующих данных и контролируемой экстраполяцией управляется для нескольких задач.
← Назад