Глубокая оптимизация
AdaDelta
Расширение AdaGrad, которое ограничивает окно накопления прошлых градиентов фиксированным размером с помощью скользящего среднего, предотвращая агрессивное снижение скорости обучения.
← Назад