AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
机器翻译(MT)
计算机过程,无需人工干预,自动将源语言文本翻译成目标语言,使用算法和语言模型。
个术语
神经机器翻译(NMT)
使用深度神经网络直接建模翻译条件概率的机器翻译方法,超越了传统统计系统。
个术语
统计机器翻译(SMT)
基于从大规模双语语料库学习到的统计模型的翻译方法,主要使用概率化语言模型和翻译模型。
个术语
注意力机制
允许NMT模型在生成每个目标词时有选择地关注源文本不同部分的技术,显著提高了翻译质量。
个术语
Transformer架构
完全基于注意力机制的神经网络架构,消除了循环和卷积,已成为现代NMT系统的标准。
个术语
BLEU分数
机器翻译的自动评估指标,通过测量n-gram的精确度将生成的翻译与人类参考进行比较。
个术语
平行语料库
双语文本集合,其中源语言中的每个句子与目标语言中的相应翻译对齐,对MT系统训练至关重要。
个术语
反向翻译
数据增强技术,训练好的NMT模型将目标语言单语文本翻译成源语言,创建合成数据以提高性能。
个术语
零样本翻译
多语言模型在训练过程中从未见过的语言对之间进行翻译的能力,使用一种中间语言作为隐含的中间媒介。
个术语
子词切分
将词汇分解为更小单位(BPE、WordPiece)的过程,以处理开放词汇并提高对罕见或未知词汇的泛化能力。
个术语
束搜索
一种解码算法,同时探索多个部分翻译假设,在每一步选择最可能的假设以平衡多样性和质量。
个术语
译后编辑
人工审查机器翻译以纠正错误并提高质量,结合自动化效率与人类语言专业知识。
个术语
多语言神经机器翻译
能够翻译多种语言对的单个系统,共享参数以受益于跨语言知识转移并降低复杂性。
个术语
语言模型
为词序列分配概率的概率模型,在神经机器翻译中用作解码组件以评估生成翻译的流畅性和连贯性。
个术语
编码器-解码器
由编码器(处理源文本为向量表示)和解码器(顺序生成目标翻译)组成的神经架构。
个术语
字节对编码(BPE)
适用于子词标记化的数据压缩算法,通过迭代合并最频繁的符号对来创建最优词汇表。
🔍