Quantificação e Otimização
Quantização por Blocos (Block-wise Quantization)
Estratégia de quantização que divide os tensores de peso em blocos menores e aplica uma quantização independente a cada bloco, preservando melhor a distribuição dos valores e reduzindo o erro global em comparação com a quantização global.
← Voltar