Quantificação por Agrupamento
Quantificação por Agrupamento
Técnica de compressão de modelos que agrupa pesos semelhantes em clusters para reduzir a memória, preservando o desempenho. Esta abordagem permite uma representação compacta dos pesos usando um número limitado de centroides representativos.
← Voltar