Computación de Precisión Mixta
INT8 Quantization
Técnica de compresión de pesos y activaciones neuronales en 8 bits enteros con signo (-128 a 127) con factores de escala y puntos cero, ofreciendo hasta 4x reducción de memoria y aceleración significativa en hardware compatible.
← Volver