Оптимизация тензорных ядер
Квантование INT8 для вывода
Преобразование весов и активаций нейронных сетей в 8-битные целые числа, позволяющее достичь до 32-кратного ускорения на тензорных ядрах с контролируемой потерей точности.
← Назад