Обучение с подкреплением для оптимизации
Глубокая Q-сеть
Архитектура глубокой нейронной сети, используемая для аппроксимации Q-функции в сложных пространствах состояний, сочетающая глубокое обучение и Q-обучение.
← Назад