Paralelismo de Modelos
Offloading
Estrategia de gestión de memoria donde los datos (pesos, gradientes, activaciones) se mueven dinámicamente entre la memoria GPU rápida y la memoria CPU más lenta pero más amplia.
← Volver