Quantification et Optimisation
Weight Quantization
Réduction de la précision des poids du modèle uniquement, en conservant les activations en précision complète pour un meilleur équilibre performance/vitesse.
← Indietro