Computação de Precisão Mista
Post-Training Quantization (PTQ) (Quantização Pós-Treinamento)
Processo de conversão de um modelo pré-treinado em precisão total para uma precisão reduzida (FP16, INT8, INT4) sem retreinamento, utilizando técnicas de calibração para determinar os fatores de escala e de polarização ideais.
← Voltar