量化 - AI 术语表

📖

个术语

量化

降低AI模型权重和激活值数值精度的过程，以优化推理性能并减少内存占用。

📖

个术语

8位量化

将模型权重从32位压缩到8位的技术，为大语言模型提供了性能和精度之间的最佳平衡。

📖

个术语

4位量化

将权重压缩到4位的极端压缩方法，可实现显著的内存增益，但可能损失质量。

📖

个术语

训练后量化（PTQ）

在模型训练后应用的技术，将权重转换为降低的精度，无需完整的重新训练。

📖

个术语

量化感知训练（QAT）

在训练过程中模拟量化效果的学习方法，以最小化精度损失。

📖

个术语

动态量化

在推理过程中实时量化激活值的方法，提供灵活性但带来计算开销。

📖

个术语

静态量化

在推理前预计算量化参数的方法，以牺牲灵活性为代价优化速度。

📖

个术语

量化校准

从代表性数据样本中确定最佳量化参数（缩放因子、零点）的过程。

📖

个术语

GPTQ

基于梯度的后训练量化，一种先进技术，通过迭代优化量化权重以最小化重构误差。

📖

个术语

AWQ

激活感知权重量化，根据相应激活的幅度对权重重要性进行加权的方法。

📖

个术语

零样本量化

无需任何校准数据的技术，使用基于权重分布的启发式方法来量化模型。

📖

个术语

混合精度量化

根据模型不同层应用不同量化精度的策略，以优化性能/精度权衡。

📖

个术语

对称量化

量化方案中值范围以零为中心，简化计算但可能未充分利用动态范围。

📖

个术语

非对称量化

允许值范围不以零为中心的方法，针对非对称分布优化量化范围的使用。

📖

个术语

缩放因子

用于将连续值映射到量化范围的乘法参数，对量化精度至关重要。

📖

个术语

零点

在非对称量化中添加的偏移量，用于将浮点零值与量化表示对齐。

📖

个术语

量化噪声

由于精度降低引入的误差，表现为因权重近似导致的模型性能下降。

📖

个术语

量化感知微调

量化后进行的轻量调整过程，旨在恢复模型压缩过程中损失的精度。

📖

个术语

SmoothQuant

通过数学变换均衡权重和激活值量化难度的量化技术。

📖

个术语

LLM.int8()

针对大型语言模型的8位量化方法，结合矩阵分解和混合量化。

AI 词汇表

量化