Quantification et Optimisation
Quantification par Blocs (Block-wise Quantization)
Stratégie de quantification qui divise les tenseurs de poids en blocs plus petits et applique une quantification indépendante à chaque bloc, préservant mieux la distribution des valeurs et réduisant l'erreur globale par rapport à la quantification globale.
← Retour