SGD distribuido
SGD Cuantificado
Enfoque que reduce la precisión numérica de los gradientes antes de la transmisión, utilizando típicamente 1-8 bits por parámetro para minimizar el tráfico de red.
← Volver