Cuantificación y Compresión
Cuantificación por Bloques (Blockwise Quantization)
Técnica que divide los tensores de peso o activaciones en bloques más pequeños y aplica una cuantificación independiente a cada bloque. Permite capturar mejor las variaciones locales de magnitud, reduciendo el error de cuantificación global.
← Volver