Computação de Precisão Mista
INT8 Quantization (Quantização INT8)
Técnica de compressão de pesos e ativações neuronais para inteiros de 8 bits com sinal (-128 a 127) com fatores de escala e pontos zero, oferecendo até 4x redução de memória e aceleração significativa em hardware compatível.
← Voltar