BenchVibe AI Ecosystem

VIP 👤

🏠 Accueil

基準測試

📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction

Modèles

🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code

Ressources

💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles

AI 詞彙表

人工智能完整詞典

200

類別

2,608

子類別

30,011

術語

参数高效微调 (PEFT)

仅修改模型参数的小子集同时冻结大部分权重的微调方法，从而降低计算和存储成本。

QLoRA (量化低秩适配)

LoRA的变体，结合4位量化和低秩适配，允许在有限硬件资源上对超大规模模型进行微调。

前缀调优

仅优化添加到输入序列中的连续前缀而不修改模型权重的方法，以使模型行为适应特定任务。

提示调优

优化专门学习的提示嵌入，以指导预训练模型的行为而不修改其内部参数。

指令微调

在指令-响应对上进行额外训练的过程，使模型学会准确遵循指令并生成适当响应。

DPO (直接偏好优化)

RLHF的替代方法，直接从人类偏好数据优化模型，无需中间奖励模型，简化对齐过程。

🔍

搵唔到結果