Paralelismo de Modelos
Descarregamento
Estratégia de gerenciamento de memória onde os dados (pesos, gradientes, ativações) são movidos dinamicamente entre a memória GPU rápida e a memória CPU mais lenta, mas mais vasta.
← Voltar