Выпуклая оптимизация в потоковом режиме
Алгоритм Adagrad
Адаптивный оптимизатор, который настраивает скорость обучения каждого параметра в зависимости от суммы квадратов исторических градиентов.
← Назад