AI 词汇表
人工智能完整词典
词干提取
一种启发式算法,通过删除单词的后缀来获取其词干,而不必产生词典中的有效词汇。比词形还原技术更快但精度较低。
词素
语言中最小的有意义单位,无法进一步分解而不失去意义。词素可以是自由的(独立词汇)或绑定的(词缀)。
词缀
附着在词基或词根上的绑定的词素,用于形成新词或改变其语法功能。词缀包括前缀、后缀、中缀和环缀。
屈折
改变单词形式以表达时态、数、性别或格等语法类别的形态过程。屈折不改变单词的基本类别。
派生
通过向现有词基添加词缀来形成新词的过程,通常改变其语法类别或意义。派生丰富了语言的词汇表。
形态分析
将单词分解为其形态学成分并识别其语法属性的计算过程。对机器翻译等许多NLP应用至关重要。
形态词基
派生词或屈折词中词缀附着的那部分,通常是词根或词元。词基构成了承载单词主要词汇意义的元素。
屈折范式
一个单词可以根据相关语法类别采取的所有屈折形式的完整集合。范式代表了形态变化的系统结构。
形态异形体
一个语素在不同使用语境下的语音或图形变化。形态异形体说明了自然语言中形态学规则的复杂性。
能产性形态学
语言中当前活跃的形态学过程集合,能够创造新的形式。与非能产性形态学形成对比,后者涉及固定不变的历史规则。
连接性形态学
一种形态学类型,其中语素通过简单的线性连接相互添加。在印欧语系语言中占主导地位,如法语或英语。
非连接性形态学
词汇形成涉及内部修改而非添加词缀的形态学系统。闪米特语系语言的特征,如阿拉伯语的词根模式。
形态学分词
将文本分割成有意义的形态学单元而非完整单词的过程。对形态学结构复杂的语言(如土耳其语或芬兰语)至关重要。
中缀
插入词根内部而非置于开头或结尾的词缀。这种现象很少见但存在于某些语言中,如塔加洛语或某些英语俚语形式。
环缀
同时作为前缀和后缀围绕一个词基插入的不连续词缀。存在于德语(ge-t)或荷兰语等语言中用于构成某些过去分词。
附着词
在句法上表现为单词但在音系上表现为附加到相邻单词的词缀的形态学元素。附着词在单词和词缀之间占据中间位置。
形态句法
研究词的形态属性如何影响其句法行为的形态学与句法学之间的界面。对于理解形式与语法功能之间的关系至关重要。
形态切分
自然语言处理中的一项任务,旨在自动将词分解为其构成词素。对于分析黏着语和识别未知词至关重要。
形态标注
自动为词元标注详细形态信息的过程,如词性、时态、语态或数。比传统的简单词性标注更为精细。