কোয়ান্টিফিকেশন এবং কম্প্রেশন
Quantification Post-Entraînement (PTQ)
Technique de réduction de précision appliquée à un modèle déjà entraîné, sans nécessiter de ré-entraînement complet. Elle convertit les poids et activations de haute précision (ex: FP32) en représentations de plus faible précision (ex: INT8) pour optimiser l'inférence.
← ফিরে যান