Trajectory Transformer
Моделирование последовательностей
Подход, который формализует обучение с подкреплением как задачу моделирования последовательностей, где состояния, действия и награды обрабатываются как токены во временной последовательности.
← Назад