Квантизация

📖

термины

Процесс снижения численной точности весов и активаций модели ИИ для оптимизации вывода и уменьшения занимаемой памяти.

📖

термины

8-битная квантизация

Техника сжатия, уменьшающая веса модели с 32 бит до 8 бит, обеспечивающая оптимальный компромисс между производительностью и точностью для LLM.

📖

термины

4-битная квантизация

Метод экстремального сжатия, уменьшающий веса до 4 бит, позволяющий получить значительный выигрыш в памяти, но с потенциальной потерей качества.

📖

термины

Посттренировочная квантизация (PTQ)

Техника, применяемая после обучения модели, преобразующая веса в пониженную точность без необходимости полного переобучения.

📖

термины

Обучение с учетом квантизации (QAT)

Подход к обучению, имитирующий эффекты квантизации в процессе обучения для минимизации потери точности.

📖

термины

Динамическая квантизация

Метод, применяемый при выводе, когда активации квантуются на лету, обеспечивая гибкость, но с вычислительными накладными расходами.

📖

термины

Статическая квантизация

Подход, предварительно вычисляющий параметры квантизации перед выводом, оптимизируя скорость в ущерб гибкости.

📖

термины

Калибровка квантизации

Процесс определения оптимальных параметров квантизации (масштаб, нулевая точка) на основе репрезентативной выборки данных.

📖

термины

GPTQ

Градиентная посттренировочная квантификация, продвинутая техника, итеративно оптимизирующая квантифицированные веса для минимизации ошибки реконструкции.

📖

термины

AWQ

Квантификация весов с учетом активаций, метод взвешивания важности весов в соответствии с амплитудой соответствующих активаций.

📖

термины

Квантификация без обучения

Техника, не требующая калибровочных данных, использующая эвристики на основе распределения весов для квантификации модели.

📖

термины

Смешанная точность квантификации

Стратегия применения различных уровней точности квантификации в зависимости от слоев модели для оптимизации компромисса производительность/точность.

📖

термины

Симметричная квантификация

Схема квантификации, где диапазон значений центрирован вокруг нуля, упрощающая вычисления, но потенциально не полностью использующая динамический диапазон.

📖

термины

Асимметричная квантификация

Подход, позволяющий использовать диапазоны значений, не центрированные на нуле, оптимизируя использование квантифицированного диапазона для асимметричных распределений.

📖

термины

Масштабный коэффициент

Мультипликативный параметр, используемый для отображения непрерывных значений в квантифицированный диапазон, критически важный для точности квантификации.

📖

термины

Нулевая точка

Смещение, добавляемое при асимметричной квантификации для выравнивания нулевого значения с плавающей запятой с квантифицированным представлением.

📖

термины

Квантовый шум

Ошибка, вносимая при снижении точности, проявляющаяся как ухудшение производительности модели из-за аппроксимации весов.

📖

термины

Тонкая настройка с учетом квантования

Процесс легкой корректировки после квантования, направленный на восстановление точности, потерянной при сжатии модели.

📖

термины

SmoothQuant

Техника квантования, выравнивающая сложность квантования между весами и активациями посредством предварительного математического преобразования.

📖

термины

LLM.int8()

Специфический метод 8-битного квантования для больших языковых моделей, сочетающий матричное разложение и гибридное квантование.

Глоссарий ИИ