🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

DistilBERT(蒸馏BERT)

通过知识蒸馏创建的BERT轻量版本,仅使用40%的参数即可保持BERT基础版97%的性能,实现更快的推理速度。

📖
个术语

位置嵌入

在BERT中添加到词元嵌入的向量,用于编码序列位置,由于注意力机制本身无法捕捉词元顺序,因此位置嵌入至关重要。

📖
个术语

BERT-base vs BERT-large

BERT的两种主要配置:基础版(12层,768隐藏维度,1.1亿参数)和大规模版(24层,1024维度,3.4亿参数),用于不同的性能/资源权衡。

📖
个术语

BERT微调

通过添加分类层并在目标任务标注数据上训练,将预训练的BERT权重适配到特定任务的过程。

📖
个术语

[SEP]标记

BERT中用于分隔不同文本段落的特殊标记(如问答任务或下一句预测任务中的句子对),标记段落之间的边界。

📖
个术语

预训练目标

用于在大型未标注语料库上预训练BERT的自监督任务(掩码语言建模和下一句预测),能够学习通用的语言表示。

📖
个术语

Transformer编码器堆栈

BERT的基本架构,由多层Transformer编码器组成,每层包含多头注意力机制和前馈网络。

📖
个术语

领域特定BERT

在专业语料库上预训练的BERT变体(BioBERT用于生物医学,SciBERT用于科学领域,FinBERT用于金融领域),在这些领域具有更好的性能。

📖
个术语

多语言BERT (mBERT)

在104种语言上预训练的BERT版本,具有共享词汇表,能够使用单一模型理解和处理多种语言的文本。

📖
个术语

BERT学

致力于分析、解释和改进BERT类模型的研究领域,研究其内部行为和语言能力。

🔍

未找到结果