Офлайн многозадачное обучение с подкреплением
Эффективность многозадачных офлайн-данных
Мера эффективности использования пакетных данных для обучения множественных политик по сравнению с однозадачным обучением.
← Назад