特定领域问答 - AI 术语表

📖

个术语

结构化知识库

按照预定义模式组织的数据集（例如：知识图谱、关系数据库），用于存储和检索QA系统的事实信息。

📖

个术语

命名实体识别（NER）

一种自然语言处理过程，用于识别和分类非结构化文本中的关键信息（人名、组织名、药物名等），以丰富知识库。

📖

个术语

合成问题生成

一种数据增强技术，从现有文档中自动创建问题和答案，以便在少量真实数据的情况下训练QA模型。

📖

个术语

知识图谱推理

QA系统通过遍历和组合知识图谱中实体（节点）之间的关系（边）来推断新信息的能力。

📖

个术语

查询重写

将用户问题（通常是模糊或表达不当的）转换为针对信息检索或知识库查询优化的查询的过程。

📖

个术语

事实核查

通过与领域内的可靠来源交叉核对，验证生成回答的一致性和准确性的机制，对于医学或金融等高风险应用至关重要。

📖

个术语

领域专用语言模型

在特定领域的文本语料库（例如：医学文章、判例法）上预训练或微调的语言模型，使其能够更准确地理解和生成技术术语。

📖

个术语

混合QA系统

结合多种方法（例如：基于规则的提取、语义搜索、神经模型）的架构，以利用各自优势并提高回答的鲁棒性和准确性。

📖

个术语

答案的可解释性

问答系统不仅提供答案，还能提供导致该答案的证据、来源或推理过程的能力，对于用户信任至关重要。

📖

个术语

语义索引

一种基于文档含义和上下文（通常通过嵌入向量）组织文档的技术，而不是基于关键词，以实现更相关的搜索。

📖

个术语

信息处理流水线

有序的步骤序列（如：摄取、清理、命名实体识别、索引），将原始数据转换为问答系统可查询的结构化知识库。

📖

个术语

基于问答数据的微调

使用特定领域的问题-答案对数据集对预训练语言模型进行适配的过程，以提高其在问答任务上的性能。

📖

个术语

问题意图检测

对用户所寻求的信息类型进行分类（如：定义、比较、列表、因果关系），以指导搜索策略并生成最合适的答案。

AI 词汇表