Глубокая оптимизация
AdaGrad
Адаптивный оптимизатор, который корректирует скорость обучения каждого параметра на основе исторической суммы квадратов его градиентов, отдавая предпочтение редким параметрам.
← Назад