量子化と圧縮
ブロックごとの量子化 (Blockwise Quantization)
重みまたは活性化テンソルをより小さなブロックに分割し、各ブロックに独立して量子化を適用する技術。これにより、局所的な大きさの変動をより捉えることができ、全体の量子化誤差を削減します。
← 戻る重みまたは活性化テンソルをより小さなブロックに分割し、各ブロックに独立して量子化を適用する技術。これにより、局所的な大きさの変動をより捉えることができ、全体の量子化誤差を削減します。
← 戻る