Mixed Precision Computing
Post-Training Quantization (PTQ)
Processus de conversion d'un modèle pré-entraîné en précision complète vers une précision réduite (FP16, INT8, INT4) sans réentraînement, utilisant des techniques de calibration pour déterminer les facteurs d'échelle et de biais optimaux.
← Retour