AI 词汇表
人工智能完整词典
Token限制
技术约束,指定模型请求或响应中可以包含的最大令牌数量。此限制直接影响RAG系统中可以使用的上下文信息量。
上下文压缩
语义化减少上下文的技术,在遵守令牌限制的同时保留关键信息。它使用摘要或提取等方法来优化可用空间。
分层上下文
将上下文组织成多个层级结构的组织方式,以优化空间并提高信息相关性。它能够有效管理上下文不同部分之间的关系。
上下文分块
将上下文智能分割成连贯块的技术,以优化检索信息的处理和集成。此技术提高RAG系统中的相关性并减少冗余。
动态上下文窗口
自适应上下文窗口,其大小根据信息的复杂性和相关性动态调整。此方法优化计算资源的使用。
上下文相关性评分
定量评估每个上下文片段与用户查询相关性的机制。此评分指导窗口中包含信息的选择和优先级排序。
上下文修剪
选择性消除相关性较低的上下文信息以优化可用空间的过程。此技术在遵守令牌约束的同时保留最有用的数据。
上下文溢出处理
当上下文超过窗口最大容量时的管理策略,包括截断、压缩或重组技术。这些机制确保处理的连续性。
多轮上下文管理
在多个对话轮次中复杂管理上下文以保持连贯性和相关性。需要持续优化窗口以整合新元素。
上下文嵌入
上下文的向量表示,支持有效的语义评估和在RAG系统中的优化集成。该技术促进上下文搜索和相似性匹配。
语义上下文检索
基于语义理解而非关键词精确匹配的上下文检索过程。这种方法提高了集成到窗口中的信息相关性。
上下文窗口填充
策略性添加上下文信息以优化可用空间使用而不超出限制的技术。填充确保更好的上下文连贯性和连续性。
上下文窗口注意力
专门应用于上下文窗口的加权注意力机制,用于识别最相关的片段。该技术优化了RAG系统中的信息选择。
自适应上下文大小调整
根据每个查询的具体要求动态调整上下文窗口大小。这种定制化方法最大化上下文处理效率。
上下文缓存策略
缓存上下文的方法,用于优化RAG系统性能并减少计算负载。允许快速检索相关上下文信息。
长上下文Transformer
优化模型架构,用于高效处理超出传统限制的超长上下文。使用高效注意力机制来管理上下文扩展。
上下文融合
智能整合多个上下文来源以创建统一且连贯表示的过程。该技术优化了上下文窗口中的空间利用。
上下文窗口优化
旨在最大化上下文窗口中信息效率和相关性的一系列技术与算法。它结合了数据的压缩、选择和战略组织。