Офлайн многозадачное обучение с подкреплением
Многозадачное распределительное обучение с подкреплением
Фреймворк, моделирующий полное распределение возвратов, а не их математическое ожидание для каждой задачи в офлайн многозадачном контексте.
← Назад