量子化と最適化
ブロック単位量子化 (Block-wise Quantization)
重みテンソルをより小さなブロックに分割し、各ブロックに独立した量子化を適用する量子化戦略です。全体量子化と比較して、値の分布をより良く保持し、全体的な誤差を低減します。
← 戻る重みテンソルをより小さなブロックに分割し、各ブロックに独立した量子化を適用する量子化戦略です。全体量子化と比較して、値の分布をより良く保持し、全体的な誤差を低減します。
← 戻る