AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
结构化知识库
按照预定义模式组织的数据集(例如:知识图谱、关系数据库),用于存储和检索QA系统的事实信息。
个术语
命名实体识别(NER)
一种自然语言处理过程,用于识别和分类非结构化文本中的关键信息(人名、组织名、药物名等),以丰富知识库。
个术语
合成问题生成
一种数据增强技术,从现有文档中自动创建问题和答案,以便在少量真实数据的情况下训练QA模型。
个术语
知识图谱推理
QA系统通过遍历和组合知识图谱中实体(节点)之间的关系(边)来推断新信息的能力。
个术语
查询重写
将用户问题(通常是模糊或表达不当的)转换为针对信息检索或知识库查询优化的查询的过程。
个术语
事实核查
通过与领域内的可靠来源交叉核对,验证生成回答的一致性和准确性的机制,对于医学或金融等高风险应用至关重要。
个术语
领域专用语言模型
在特定领域的文本语料库(例如:医学文章、判例法)上预训练或微调的语言模型,使其能够更准确地理解和生成技术术语。
个术语
混合QA系统
结合多种方法(例如:基于规则的提取、语义搜索、神经模型)的架构,以利用各自优势并提高回答的鲁棒性和准确性。
个术语
答案的可解释性
问答系统不仅提供答案,还能提供导致该答案的证据、来源或推理过程的能力,对于用户信任至关重要。
个术语
语义索引
一种基于文档含义和上下文(通常通过嵌入向量)组织文档的技术,而不是基于关键词,以实现更相关的搜索。
个术语
信息处理流水线
有序的步骤序列(如:摄取、清理、命名实体识别、索引),将原始数据转换为问答系统可查询的结构化知识库。
个术语
基于问答数据的微调
使用特定领域的问题-答案对数据集对预训练语言模型进行适配的过程,以提高其在问答任务上的性能。
个术语
问题意图检测
对用户所寻求的信息类型进行分类(如:定义、比较、列表、因果关系),以指导搜索策略并生成最合适的答案。
🔍