Глоссарий ИИ
Полный словарь искусственного интеллекта
Квантование весов
Снижение точности только весов модели с сохранением полной точности активаций для лучшего баланса между производительностью и скоростью.
Квантование активаций
Процесс снижения точности активаций (выходов слоев) вместе с весами для максимальной оптимизации модели.
8-битное квантование
Преобразование параметров модели с 32 или 16 бит в 8 бит, сокращая использование памяти на 75% при умеренном влиянии на точность.
4-битное квантование
Экстремальная техника сокращения до 4 бит, позволяющая добиться значительных gains в использовании памяти, но требующая продвинутых алгоритмов для поддержания производительности.
Динамическое квантование
Квантование, применяемое динамически во время вывода, адаптируя параметры квантования в реальном времени в зависимости от входных данных.
Статическое квантование
Предварительный расчет параметров квантования на фиксированном наборе калибровки, оптимизирующий скорость, но требующий представительных данных.