Quantificação e Compressão
Fatoração de Matriz de Baixo Rank
Técnica de compressão que decompõe uma grande matriz de pesos em duas ou mais matrizes menores. Ela reduz o número de parâmetros e as operações de multiplicação de matrizes, acelerando assim as camadas densas e convolucionais.
← Voltar