Оптимизация на основе импульса
AMSGrad
Модификация Adam, гарантирующая теоретическую сходимость путем сохранения максимума квадратов экспоненциальных скользящих средних во избежание потенциальных расхождений Adam.
← Назад