基于实体提取的问答

📖

个术语

命名实体识别 (NER)

自然语言处理 (NLP) 的子任务，旨在从非结构化文本中识别和分类预定义实体，如人员、组织或地点。

📖

个术语

实体提取

从非结构化文本数据中识别和提取特定的结构化信息（实体），以填充知识库的过程。

📖

个术语

实体标记

将语义标签（标记）关联到从文本中提取的实体的操作，使其能够被分类并在问答系统中使用。

📖

个术语

实体词典

包含有效实体及其类型的数据库或结构化列表，在问答系统中用作识别和验证的参考。

📖

个术语

命名实体识别的监督学习

一种方法，其中命名实体识别模型在手动标注的文本语料库上训练，以学习识别和分类实体。

📖

个术语

序列到序列模型 (Seq2Seq)

用于复杂命名实体识别任务的神经网络架构，处理输入序列（文本）以生成输出序列（实体标签）。

📖

个术语

上下文嵌入 (ELMo, BERT)

词的向量表示，根据周围上下文捕捉其含义，显著提高模糊实体提取的准确性。

📖

个术语

实体标准化

标准化提取的实体的过程（例如：将'Mardi'、'mar.'和'Mardi'转换为规范形式）以确保数据一致性。

📖

个术语

实体链接

将文本中提到的命名实体连接到知识库中唯一条目（如DBpedia或Wikidata的URI）的任务。

📖

个术语

标注语料库

一组文本，其中的实体已由人类预先识别和标记，作为训练和评估命名实体识别模型的基准事实。

📖

个术语

抽取中的假阳性

系统错误地将文本片段识别为相关实体的错误，对问答系统的准确性产生负面影响。

📖

个术语

抽取管道

一系列顺序连接的模块（分词、命名实体识别、规范化、链接），将原始文本转换为可用的结构化实体。

📖

个术语

基于知识的问答系统

通过查询结构化知识库来找到答案的问答系统类型，该知识库通过实体和关系抽取填充。

📖

个术语

混合命名实体识别

结合基于规则的方法（模式匹配）和机器学习模型的方法，利用前者的准确性和后者的灵活性。

📖

个术语

实体消歧

当同一字符串可以指代多个不同实体时解决歧义的任务（例如：'巴黎'城市与'巴黎'神话）。

📖

个术语

命名实体识别的微调

在特定语料库上调整预训练语言模型（如BERT）以执行命名实体识别任务的过程。

AI 词汇表