Распределенный SGD
Квантованный SGD
Подход, снижающий числовую точность градиентов перед передачей, обычно использующий 1–8 бит на параметр для минимизации сетевого трафика.
← НазадПодход, снижающий числовую точность градиентов перед передачей, обычно использующий 1–8 бит на параметр для минимизации сетевого трафика.
← Назад