Квантизация и сжатие
Блочная квантизация (Blockwise Quantization)
Техника, которая делит тензоры весов или активаций на меньшие блоки и применяет независимую квантизацию к каждому блоку. Она позволяет лучше улавливать локальные изменения величины, уменьшая общую ошибку квантизации.
← Назад