Офлайн многозадачное обучение с подкреплением
Многозадачное Q-обучение с ограничениями по пакету
Расширение BCQ в многозадачном контексте, где Q-функция ограничена пакетными данными при одновременном обмене знаниями между задачами.
← Назад