AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
自然语言处理的主动学习
一种学习范式,模型智能选择最具信息量的文本样本进行标注,从而优化自然语言处理任务中人工标注资源的利用。
个术语
密度加权主动学习
一种结合模型不确定性与特征空间密度的方法,优先选择位于数据密集区域的不确定性文本样本。
个术语
基于池的主动学习
一种框架,算法拥有固定的未标注文本样本池,并迭代选择最具信息量的实例进行人工标注。
个术语
基于流的主动学习
一种范式,文本数据顺序到达,模型必须实时决定是否标注或拒绝每个实例,且无法回溯。
个术语
批量模式主动学习
一种变体,同时选择多个文本样本进行标注,在保持所选实例多样性的同时优化批量人工标注流程。
个术语
序列标注的主动学习
针对命名实体识别或词性标注等序列标注任务的主动学习专门化方法,选择层面为整个序列或单个词元。
个术语
核心集选择
一种理论方法,确保所选集合能良好近似完整数据集,常用于自然语言处理主动学习场景并带有性能保证。
个术语
标注成本建模
一种将可变标注成本(时间、所需专业知识)纳入样本选择过程的技术,优化自然语言处理项目的成本效益比。
个术语
低资源语言的主动学习
针对可用数据量少的语言的主动学习专门应用,利用迁移和选择策略来适应语言约束。
个术语
基于预训练模型的主动学习
将主动学习与BERT等预训练语言模型相结合,利用上下文表示来改进信息样本的选择。
个术语
多任务主动学习
使用单一标注集同时改进多个NLP任务的框架,优化对整体任务都有益的样本选择。
个术语
文本分类的主动学习
针对文档分类任务的主动学习专门化,使用适应高维文本数据特性的策略。
个术语
主动学习中的冷启动问题
模型缺乏标注数据以做出可靠预测的初始挑战,需要随机采样或半监督学习等初始化策略。
🔍