Paralelismo de Modelos
DeepSpeed
Biblioteca de optimización de Microsoft que implementa técnicas avanzadas como ZeRO, paralelismo híbrido y compresión de memoria para el entrenamiento de modelos a gran escala.
← Volver