Modelos de Baixos Recursos
Poda Estruturada
Técnica de poda de modelo que remove componentes inteiros e coerentes (cabeças de atenção, neurônios, camadas) em vez de pesos individuais, a fim de reduzir o tamanho computacional, mantendo uma arquitetura compatível com aceleradores de hardware.
← Voltar