Офлайн многозадачное обучение с подкреплением
Метрики многозадачного офлайн-оценивания
Специфические меры для оценки производительности многозадачных политик без взаимодействия, такие как многозадачный FQE или взвешенный importance sampling.
← Назад