自动翻译 - AI 术语表

📖

个术语

机器翻译（MT）

计算机过程，无需人工干预，自动将源语言文本翻译成目标语言，使用算法和语言模型。

📖

个术语

神经机器翻译（NMT）

使用深度神经网络直接建模翻译条件概率的机器翻译方法，超越了传统统计系统。

📖

个术语

统计机器翻译（SMT）

基于从大规模双语语料库学习到的统计模型的翻译方法，主要使用概率化语言模型和翻译模型。

📖

个术语

注意力机制

允许NMT模型在生成每个目标词时有选择地关注源文本不同部分的技术，显著提高了翻译质量。

📖

个术语

Transformer架构

完全基于注意力机制的神经网络架构，消除了循环和卷积，已成为现代NMT系统的标准。

📖

个术语

BLEU分数

机器翻译的自动评估指标，通过测量n-gram的精确度将生成的翻译与人类参考进行比较。

📖

个术语

平行语料库

双语文本集合，其中源语言中的每个句子与目标语言中的相应翻译对齐，对MT系统训练至关重要。

📖

个术语

反向翻译

数据增强技术，训练好的NMT模型将目标语言单语文本翻译成源语言，创建合成数据以提高性能。

📖

个术语

零样本翻译

多语言模型在训练过程中从未见过的语言对之间进行翻译的能力，使用一种中间语言作为隐含的中间媒介。

📖

个术语

子词切分

将词汇分解为更小单位（BPE、WordPiece）的过程，以处理开放词汇并提高对罕见或未知词汇的泛化能力。

📖

个术语

束搜索

一种解码算法，同时探索多个部分翻译假设，在每一步选择最可能的假设以平衡多样性和质量。

📖

个术语

译后编辑

人工审查机器翻译以纠正错误并提高质量，结合自动化效率与人类语言专业知识。

📖

个术语

多语言神经机器翻译

能够翻译多种语言对的单个系统，共享参数以受益于跨语言知识转移并降低复杂性。

📖

个术语

语言模型

为词序列分配概率的概率模型，在神经机器翻译中用作解码组件以评估生成翻译的流畅性和连贯性。

📖

个术语

编码器-解码器

由编码器（处理源文本为向量表示）和解码器（顺序生成目标翻译）组成的神经架构。

📖

个术语

字节对编码（BPE）

适用于子词标记化的数据压缩算法，通过迭代合并最频繁的符号对来创建最优词汇表。

AI 词汇表