协同过滤

📖

个术语

推荐方法，通过收集众多用户的偏好来生成预测，基于过去品味相似的用户未来品味也会相似的原理。

📖

个术语

用户-物品矩阵

基础数据结构，其中行代表用户，列代表物品，单元格包含评分或交互，通常非常稀疏，因为每个用户只与少量物品交互。

📖

个术语

余弦相似度

相似性度量，计算多维空间中两个评分向量之间的夹角余弦值，范围从-1（完全对立）到1（完全相似），广泛用于比较用户或物品的配置文件。

📖

个术语

皮尔逊相关系数

衡量两个评分向量之间线性相关性的系数，以平均值为中心并标准化，特别有效于捕获用户或物品之间的相对评分趋势。

📖

个术语

k近邻

算法，识别与给定目标最相似的k个用户或物品以形成一个邻域，用于预测计算，其中k是控制推荐粒度的关键参数。

📖

个术语

基于用户的协同过滤

基于用户之间相似性的方法，推荐相似用户喜欢的物品，需要计算用户-用户相似性并有效管理变化的配置文件。

📖

个术语

基于物品的协同过滤

基于物品之间相似性的方法，推荐与用户已经喜欢的物品相似的物品，通常比基于用户的方法更稳定和可扩展，因为物品的变化频率较低。

📖

个术语

冷启动问题

主要挑战，由于缺乏历史数据，系统无法为新用户或物品生成可靠的推荐，需要初始化策略和主动收集信息。

📖

个术语

稀疏矩阵

推荐系统的固有特性，其中用户-物品矩阵中的大部分单元格是空的，这带来了计算上的挑战，需要优化的数据结构和插补技术。

📖

个术语

显式评分与隐式评分

用户自愿提供的直接评分（显式）与基于观察到的行为推断出的偏好（隐式）之间的区别，每种评分都有其特定的偏差和处理方法。

📖

个术语

流行度偏差

协同过滤中系统性地过度推荐流行物品而牺牲多样性的趋势，这可能导致强化反馈循环，并限制发现相关小众物品。

📖

个术语

评分预测

估算用户对未评分物品可能给出的评分的过程，通常计算为邻近用户或相似物品评分的加权组合，并进行偏差调整。

📖

个术语

Top-N 推荐

一种推荐方法，为用户生成一个包含N个最相关物品的排序列表，与精确的评分预测相比，它以不同的方式优化算法，并需要特定的评估指标。

📖

个术语

Z-score 标准化

一种通过减去平均值并除以标准差来标准化用户评分的技术，使得可以比较使用不同评分尺度的用户，并减少个体偏差的影响。

📖

个术语

置信度分数

一个用于量化计算出的相似度或预测可靠性的指标，通常基于共同评分的数量及其方差，用于在推荐计算中权衡各项贡献。

📖

个术语

时间加权

一种为近期评分赋予比旧评分更高权重的方法，反映了用户偏好的演变，并确保推荐在面对品味变化时保持相关性。

📖

个术语

预测聚合

将来自不同邻居或方法的多个预测组合成一个最终推荐的过程，使用加权平均、中位数或元学习等技术来优化准确性。

📖

个术语

RMSE (均方根误差)

一种标准评估指标，衡量预测值与实际评分之间误差平方的平均值的平方根，对大误差有很强的惩罚作用，并且对异常值敏感。

📖

个术语

MAE (平均绝对误差)

一种计算预测误差绝对值平均值的指标，比RMSE更具直观性，并且在评估推荐系统时对异常值的敏感性较低。

AI 词汇表