Cuantificación y Optimización
Cuantificación por Bloques (Block-wise Quantization)
Estrategia de cuantificación que divide los tensores de pesos en bloques más pequeños y aplica una cuantificación independiente a cada bloque, preservando mejor la distribución de los valores y reduciendo el error global en comparación con la cuantificación global.
← Volver