AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
音译
基于语音对应关系将文本从一种文字系统转换为另一种文字系统的过程,对于处理阿拉伯语或西里尔字母等不同字母表的多语言系统至关重要。
術語
多语言模型(mBERT、XLM-R)
在多种语言的平行或拼接语料库上预训练的Transformer模型,能够理解并生成100多种语言的文本,无需针对特定语言进行训练。
術語
语言锚点
使用枢轴语言(通常是英语)作为共同语义表示空间的架构策略,以促进多语言对话系统中信息在多种语言间的传递。
術語
多语言处理流水线
集成专门模块(语言检测、适应性分词、特定模型)的顺序架构,用于处理多语言环境下自然语言处理的不同阶段。
術語
多语言评估(BLEU、chrF)
适用于多语言环境的评估指标,用于衡量翻译或生成回答的质量,如chrF++对多种语言形态特征更为敏感。
術語
文化多样性管理
使对话系统不仅能在语言上适应,还能在文化上适应的技术集合,考虑特定文化的社会规范、参考和背景。
術語
多语言弱监督语言模型
结合多种语言大量未标注数据和最少标注的训练方法,在监督数据稀缺的情况下构建鲁棒系统。
術語
多语言语义空间对齐
将不同语言的向量空间投影到共同语义空间的技术,允许直接比较不同语言单词和短语的意义。
術語
多语言文本规范化
文本标准化过程,包括处理书写变体(简体/繁体)、变音符号、大小写以及每种语言特有的约定,以实现一致的处理。
術語
混合多语言对话系统
在统一框架中结合基于规则的方法(用于低资源语言)和神经模型(用于资源丰富语言)的架构,以优化整体性能。
術語
跨语言迁移
一种翻译范式,源文本首先转换为独立于语言的中间语义表示,然后生成目标语言,便于多语言翻译。
術語
回译
一种数据增强技术,通过将单语目标数据翻译回源语言,再翻译回目标语言来生成合成翻译,从而创建人工平行语料对。
🔍