SGD Distribuído
SGD Quantizado
Abordagem que reduz a precisão numérica dos gradientes antes da transmissão, utilizando tipicamente 1-8 bits por parâmetro para minimizar o tráfego de rede.
← Voltar