AI 词汇表
人工智能完整词典
协同过滤
推荐方法,通过收集众多用户的偏好来生成预测,基于过去品味相似的用户未来品味也会相似的原理。
用户-物品矩阵
基础数据结构,其中行代表用户,列代表物品,单元格包含评分或交互,通常非常稀疏,因为每个用户只与少量物品交互。
余弦相似度
相似性度量,计算多维空间中两个评分向量之间的夹角余弦值,范围从-1(完全对立)到1(完全相似),广泛用于比较用户或物品的配置文件。
皮尔逊相关系数
衡量两个评分向量之间线性相关性的系数,以平均值为中心并标准化,特别有效于捕获用户或物品之间的相对评分趋势。
k近邻
算法,识别与给定目标最相似的k个用户或物品以形成一个邻域,用于预测计算,其中k是控制推荐粒度的关键参数。
基于用户的协同过滤
基于用户之间相似性的方法,推荐相似用户喜欢的物品,需要计算用户-用户相似性并有效管理变化的配置文件。
基于物品的协同过滤
基于物品之间相似性的方法,推荐与用户已经喜欢的物品相似的物品,通常比基于用户的方法更稳定和可扩展,因为物品的变化频率较低。
冷启动问题
主要挑战,由于缺乏历史数据,系统无法为新用户或物品生成可靠的推荐,需要初始化策略和主动收集信息。
稀疏矩阵
推荐系统的固有特性,其中用户-物品矩阵中的大部分单元格是空的,这带来了计算上的挑战,需要优化的数据结构和插补技术。
显式评分与隐式评分
用户自愿提供的直接评分(显式)与基于观察到的行为推断出的偏好(隐式)之间的区别,每种评分都有其特定的偏差和处理方法。
流行度偏差
协同过滤中系统性地过度推荐流行物品而牺牲多样性的趋势,这可能导致强化反馈循环,并限制发现相关小众物品。
评分预测
估算用户对未评分物品可能给出的评分的过程,通常计算为邻近用户或相似物品评分的加权组合,并进行偏差调整。
Top-N 推荐
一种推荐方法,为用户生成一个包含N个最相关物品的排序列表,与精确的评分预测相比,它以不同的方式优化算法,并需要特定的评估指标。
Z-score 标准化
一种通过减去平均值并除以标准差来标准化用户评分的技术,使得可以比较使用不同评分尺度的用户,并减少个体偏差的影响。
置信度分数
一个用于量化计算出的相似度或预测可靠性的指标,通常基于共同评分的数量及其方差,用于在推荐计算中权衡各项贡献。
时间加权
一种为近期评分赋予比旧评分更高权重的方法,反映了用户偏好的演变,并确保推荐在面对品味变化时保持相关性。
预测聚合
将来自不同邻居或方法的多个预测组合成一个最终推荐的过程,使用加权平均、中位数或元学习等技术来优化准确性。
RMSE (均方根误差)
一种标准评估指标,衡量预测值与实际评分之间误差平方的平均值的平方根,对大误差有很强的惩罚作用,并且对异常值敏感。
MAE (平均绝对误差)
一种计算预测误差绝对值平均值的指标,比RMSE更具直观性,并且在评估推荐系统时对异常值的敏感性较低。