Optimización de Transformers
Paralelismo de Modelo
Estrategia de distribución donde los diferentes componentes de un modelo se colocan en diferentes dispositivos computacionales para manejar modelos que exceden la memoria de un solo GPU.
← Volver