Model-Based Offline RL
Трансформеры траекторий
Архитектура трансформера, моделирующая траектории как последовательности состояний, действий и наград для предсказания будущих переходов в офлайн обучении.
← Назад