AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
参数高效微调 (PEFT)
仅修改模型参数的小子集同时冻结大部分权重的微调方法,从而降低计算和存储成本。
術語
QLoRA (量化低秩适配)
LoRA的变体,结合4位量化和低秩适配,允许在有限硬件资源上对超大规模模型进行微调。
術語
前缀调优
仅优化添加到输入序列中的连续前缀而不修改模型权重的方法,以使模型行为适应特定任务。
術語
提示调优
优化专门学习的提示嵌入,以指导预训练模型的行为而不修改其内部参数。
術語
指令微调
在指令-响应对上进行额外训练的过程,使模型学会准确遵循指令并生成适当响应。
術語
DPO (直接偏好优化)
RLHF的替代方法,直接从人类偏好数据优化模型,无需中间奖励模型,简化对齐过程。
🔍