Quantification et Optimisation
Quantification Consciente de la Quantification (QAT)
Méthode d'optimisation où la simulation de la quantification basse précision est intégrée durant l'entraînement, permettant au modèle d'adapter ses poids pour minimiser la perte de performance induite par la quantification.
← Retour