Глоссарий ИИ
Полный словарь искусственного интеллекта
Калибровочный набор данных
Представительное подмножество обучающих данных, используемое для определения оптимальных диапазонов значений при статической квантовании; необходимо для вычисления масштабных коэффициентов и точек нуля.
Деквантование
Обратный процесс квантования, преобразующий целочисленные значения низкой точности обратно в числа с плавающей запятой для вычислений, требующих более высокой точности во время инференса.
Квантование смешанной точности
Гибридная стратегия, применяющая различные уровни точности (8 бит, 4 бита, 2 бита) к разным слоям модели в зависимости от их чувствительности к квантованию.
Поканальное квантование
Техника квантования, применяющая различные масштабные коэффициенты для каждого выходного канала сверточного слоя, что значительно повышает точность для CNN.
Постензорное квантование
Более простой подход, использующий единый масштабный коэффициент и точку нуля для всего тензора; менее точен, но вычисляется быстрее, чем поканальное квантование.
Диапазон отсечения
Диапазон значений, определяемый во время калибровки для ограничения экстремальных значений перед квантованием; необходим для минимизации ошибки квантования путем исключения выбросов.
Послойное квантование
Метод, который независимо оптимизирует параметры квантования для каждого слоя сети с учетом специфических характеристик распределения каждого слоя.
Ошибка квантования
Разница между исходными значениями с плавающей запятой и их квантованными представлениями, измеряемая такими метриками, как MSE или расхождение Кульбака-Лейблера, для оценки качества квантования.
Целочисленный инференс
Парадигма выполнения, при которой все операции модели осуществляются в целочисленной арифметике, полностью исключая преобразования в числа с плавающей точкой для достижения максимальной производительности.