Глоссарий ИИ
Полный словарь искусственного интеллекта
Quantification Structurellement Contrainte
Technique de compression neuronale qui applique des contraintes de quantification spécifiques tout en préservant l'architecture et les relations structurelles du réseau neuronal.
Quantification Aware Training (QAT)
Méthode d'entraînement qui simule les effets de la quantification pendant le processus d'apprentissage pour minimiser la perte de précision post-quantification.
Post-Training Quantification (PTQ)
Processus de quantification appliqué après l'entraînement complet du modèle sans nécessiter de réentraînement supplémentaire.
Granularité de Quantification
Niveau de détail auquel les paramètres sont regroupés pour la quantification, variant du niveau tenseur au niveau canal ou groupe.
Biais de Quantification
Erreur systématique introduite lors de la conversion des nombres à virgule flottante en représentation à faible précision.
Calibration de Quantification
Processus de détermination des paramètres de quantification optimaux (scale et zero-point) en analysant la distribution des activations.
Clustering de Poids
Technique regroupant les poids similaires en clusters partageant une valeur représentative commune pour réduire la complexité.
Précision Quantifiée
Nombre de bits utilisés pour représenter chaque valeur quantifiée, typiquement 8, 4, 2 ou 1 bit dans les méthodes extrêmes.
Динамический диапазон
Диапазон значений, который может быть представлен квантованным форматом, что имеет решающее значение для сохранения важной информации модели.
Квантование низкой точности
Экстремальное сжатие, использующее менее 8 бит на параметр, требующее применения передовых методов для поддержания производительности.
Реконструкция весов
Процесс оптимизации, направленный на минимизацию ошибки между исходными весами и их реконструированными квантованными версиями.
Оптимизация структуры квантования
Алгоритмы, автоматически определяющие оптимальную конфигурацию квантования для каждой части сети.
Чувствительность к квантованию
Мера влияния квантования на производительность конкретного слоя, определяющая стратегии гетерогенного квантования.
Квантование с топологическими ограничениями
Подход, сохраняющий топологические свойства сети при применении конкретных ограничений квантования.