AI-woordenlijst
Het complete woordenboek van kunstmatige intelligentie
Calibration Dataset
Sous-ensemble représentatif des données d'entraînement utilisé pour déterminer les plages de valeurs optimales lors de la quantification statique, essentiel pour calculer les facteurs d'échelle et points zéro.
Dequantization
Processus inverse de la quantification convertissant les valeurs entiers de faible précision back en virgule flottante pour les calculs nécessitant une précision supérieure durant l'inférence.
Mixed Precision Quantization
Stratégie hybride appliquant différents niveaux de précision (8-bit, 4-bit, 2-bit) aux différentes couches du modèle selon leur sensibilité à la quantification.
Per-channel Quantization
Technique de quantification appliquant des facteurs d'échelle distincts pour chaque canal de sortie d'une couche convolutive, améliorant significativement la précision pour les CNN.
Per-tensor Quantization
Approche plus simple utilisant un seul facteur d'échelle et point zéro pour l'ensemble d'un tenseur, moins précise mais plus rapide à calculer que la quantification per-canal.
Clipping Range
Plage de valeurs définie pendant la calibration pour limiter les extrêmes avant quantification, essentielle pour minimiser l'erreur de quantification en excluant les outliers.
Layer-wise Quantization
Méthode optimisant indépendamment les paramètres de quantification pour chaque couche du réseau, tenant compte des caractéristiques spécifiques de distribution de chaque couche.
Quantization Error
Différence entre les valeurs originales en virgule flottante et leurs représentations quantifiées, mesurée par des métriques comme MSE ou KL divergence pour évaluer la qualité de quantification.
Integer-only Inference
Paradigme d'exécution où toutes les opérations du modèle sont effectuées en arithmétique entière, éliminant complètement les conversions en virgule flottante pour une performance maximale.