AI 詞彙表
人工智能完整詞典
交叉编码器重排序
一种重排序架构,其中变换器将查询和每个文档作为单个输入序列同时处理,以评估它们的相互相关性。这种方法以更高的计算复杂度为代价提供了高精度。
MonoT5重排序
基于T5的重排序模型,通过使用特殊标记'True'和'False'将排序任务重新表述为文本生成问题。这种方法利用自然语言理解能力有效重排序检索到的文档。
ColBERT重排序
基于令牌级延迟交互的重排序系统,将文档和查询编码为每个令牌的上下文向量。该方法在保持可接受计算效率的同时捕获细粒度匹配。
BGE重排序器
针对语义搜索任务优化的重排序模型,使用交叉编码器架构在大量相关性数据语料库上训练。它在RAG系统中擅长区分相关和不相关文档。
列表损失
直接优化检索文档列表完整顺序而非单个对偶的损失函数。该方法考虑全局相关性分布以改进重排序质量。
对偶损失
比较文档对偶以学习区分更相关和较不相关文档的训练函数。该方法在监督学习重排序系统中特别有效。
多阶段检索
由多个连续阶段组成的检索架构,包括初始广泛检索和随后一个或多个逐渐更精确的重排序级别。这种方法在大规模RAG系统中平衡效率和精度。
段落重排序
专门应用于段落或文本片段而非整个文档的重排序过程,以提高相关内容选择的粒度。该技术优化RAG中生成的输入质量。
学习排序(LTR)
应用于信息排序的机器学习范式,训练模型根据相关性对项目进行排序。LTR结合多种特征来优化如NDCG和MAP等排序指标。
神经信息检索
使用神经网络通过密集向量表示来建模查询与文档之间相关性的信息检索方法。该方法能捕捉超越简单关键词匹配的复杂语义关系。
密集检索重排序
基于密集嵌入的重排序技术,利用语义空间中的向量相似度重新评估初始检索文档的相关性。该方法优化初始检索结果以提升最终质量。
查询-文档交互
重排序系统中的基本机制,显式建模查询项与文档项之间的交互以计算相关性得分。该方法能捕捉超越独立表示的复杂依赖关系。
相关性反馈循环
迭代过程,其中对排序结果的相关性判断被用于优化重排序模型或查询本身。这种自适应学习技术持续提升系统性能。
基于注意力的重排序
使用注意力机制识别并加权文档中与查询最相关部分的重排序架构。该方法支持对文档相关性进行精细的上下文评估。