AI 词汇表
人工智能完整词典
问答系统
能够理解自然语言问题,并依赖于知识库或文档来提供相关答案的计算机系统。这些系统通常结合了自然语言处理(NLP)、信息检索和自动推理等技术。
检索式问答
一种问答方法,它直接从预存的文档语料库中识别并提取答案,而不生成新内容。该方法专注于搜索和选择与所提问题最相关的文本来作为答案。
生成式问答
一种生成新的自然语言答案的问答系统,而非提取现有文本。它使用像GPT这样的先进语言模型,能够基于对上下文的理解,形成原创且连贯的答案。
开放域问答
能够回答任何领域问题而不受领域限制的问答系统,通常依赖于维基百科或网络等大规模语料库。与封闭域系统相比,这些系统必须应对更大的模糊性和多样性。
封闭域问答
专注于特定领域(如医学、法律或金融)的问答系统,拥有有限且明确定义的知识库。这种专业化使其能够提供更精确、更深入的答案。
阅读理解
系统理解和解读给定文本,并据此回答关于该文本的具体问题的能力,通常在SQuAD等数据集上进行评估。作为自然语言处理(NLP)的一项基本技能,它测试的是系统的语义理解和文档推理能力。
知识图谱问答
一种通过查询结构化知识图谱来找到事实性答案的问答方法,通常需要将自然语言问题转换为形式化查询。该方法在处理关于实体及其关系的精确事实性问题时表现出色。
神经问答
使用深度神经网络来实现问答系统,使其能够自动学习复杂的语言表示。这些方法在很大程度上超越了基于规则或人工特征的传统方法。
Transformer问答模型
一种基于注意力机制的神经网络架构,目前在现代问答系统中占主导地位,如BERT和RoBERTa。Transformer能够有效捕获文本中的长距离依赖关系。
用于问答的BERT
BERT(Bidirectional Encoder Representations from Transformers)模型在问答任务中的特定应用,经过微调后已成为该领域的基准。BERT在语言的双向上下文理解方面表现出色。
段落检索
问答系统中的关键步骤,指从大量文档中识别和选择与问题最相关的文本段落。此步骤通常使用语义搜索和向量相似性技术。
答案提取
在相关文本段落中识别和隔离准确答案的过程,通常被视为序列分类或命名实体识别任务。该技术是提取式问答系统的核心。
事实性问答
专注于事实性问题的问答类型,这些问题具有简短而精确的答案,如姓名、日期或数字。这些系统根据其在文档中检索准确事实信息的能力进行评估。
非事实性问答
需要描述性答案、解释或综合的问答类别,而非孤立的事实,如'为什么'或'如何'类型的问题。这些系统需要更深的理解和推理能力。
对话式问答
能够在多轮对话中保持连贯性的问答系统,考虑对话上下文和先前问题。此方法需要管理历史记录和照应指代。
多跳问答
需要结合多个文档或段落的信息来构建完整答案的高级问答系统。此方法模拟多步推理来回答复杂问题。
Zero-Shot QA
指系统在未经过特定领域或主题训练的情况下,仅依靠其通用知识来回答问题的能力。这种技能展示了系统对语言真正的理解和泛化能力。
Fine-Tuning for QA
通过使用SQuAD或Natural Questions等标注数据集,对预训练语言模型进行专门调整以适应问答任务的过程。该技术可在特定问答任务上获得最佳性能。
Attention Mechanism in QA
现代问答模型的核心组件,它使系统能够专注于上下文中最相关的部分来回答给定问题。注意力机制会根据问题对上下文中每个词的重要性进行加权。
Question Classification
问答系统中的初步步骤,它根据问题类型(谁、什么、何时、何地、为何、如何)对问题进行分类,以调整答案搜索策略。这种分类有助于引导系统找到正确的信息来源和提取方法。