AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
命名实体识别 (NER)
自然语言处理 (NLP) 的子任务,旨在从非结构化文本中识别和分类预定义实体,如人员、组织或地点。
个术语
实体提取
从非结构化文本数据中识别和提取特定的结构化信息(实体),以填充知识库的过程。
个术语
实体标记
将语义标签(标记)关联到从文本中提取的实体的操作,使其能够被分类并在问答系统中使用。
个术语
实体词典
包含有效实体及其类型的数据库或结构化列表,在问答系统中用作识别和验证的参考。
个术语
命名实体识别的监督学习
一种方法,其中命名实体识别模型在手动标注的文本语料库上训练,以学习识别和分类实体。
个术语
序列到序列模型 (Seq2Seq)
用于复杂命名实体识别任务的神经网络架构,处理输入序列(文本)以生成输出序列(实体标签)。
个术语
上下文嵌入 (ELMo, BERT)
词的向量表示,根据周围上下文捕捉其含义,显著提高模糊实体提取的准确性。
个术语
实体标准化
标准化提取的实体的过程(例如:将'Mardi'、'mar.'和'Mardi'转换为规范形式)以确保数据一致性。
个术语
实体链接
将文本中提到的命名实体连接到知识库中唯一条目(如DBpedia或Wikidata的URI)的任务。
个术语
标注语料库
一组文本,其中的实体已由人类预先识别和标记,作为训练和评估命名实体识别模型的基准事实。
个术语
抽取中的假阳性
系统错误地将文本片段识别为相关实体的错误,对问答系统的准确性产生负面影响。
个术语
抽取管道
一系列顺序连接的模块(分词、命名实体识别、规范化、链接),将原始文本转换为可用的结构化实体。
个术语
基于知识的问答系统
通过查询结构化知识库来找到答案的问答系统类型,该知识库通过实体和关系抽取填充。
个术语
混合命名实体识别
结合基于规则的方法(模式匹配)和机器学习模型的方法,利用前者的准确性和后者的灵活性。
个术语
实体消歧
当同一字符串可以指代多个不同实体时解决歧义的任务(例如:'巴黎'城市与'巴黎'神话)。
个术语
命名实体识别的微调
在特定语料库上调整预训练语言模型(如BERT)以执行命名实体识别任务的过程。
🔍