语言模型

📖

術語

一种统计或神经的系统，用于计算词汇序列在某种语言中出现的概率。这些模型从大量文本语料库中学习上下文和语法依赖关系，以生成或评估自然语言。

📖

術語

一种基于注意力机制的神经网络架构，并行处理序列而不依赖时间顺序。Transformer因能够捕捉长距离依赖关系而彻底改变了语言模型。

📖

術語

基于仅从左到右解码的Transformer架构的生成式语言模型家族。GPT模型专门用于生成连贯文本和序列补全。

📖

術語

基于马尔可夫假设的统计语言模型，即一个词的概率仅依赖于前面的n-1个词。N-grams是神经网络时代之前语言模型的传统方法。

📖

術語

一种循环神经网络，通过维护随每个标记演变的隐藏状态来处理序列。RNN是最早应用于语言模型以捕捉时间依赖关系的神经网络架构之一。

📖

術語

RNN的高级变体，使用遗忘门和记忆门来处理长距离依赖关系。LSTM克服了传统RNN在语言建模应用中的梯度消失问题。

📖

術語

仅基于序列中前面的词来预测下一个词的训练模型。因果模型特别适合文本生成和补全任务。

📖

術語

使用完整的双向上下文来预测序列中被掩码词的训练模型。这种方法为分析和分类任务提供了更好的上下文理解。

AI 詞彙表