AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
模型版本控制
机器学习模型版本管理系统,用于跟踪迭代、比较性能并在性能退化时回退到之前的版本。
个术语
数据版本控制(DVC)
扩展Git的开源工具,用于管理大型数据集和模型的版本控制,将元数据存储在Git中,二进制文件存储在云存储中。
个术语
Git LFS
Git大型文件存储,Git的扩展,允许对大型文件(如数据集和模型)进行版本控制,将其与Git主仓库分开存储。
个术语
实验跟踪
系统化记录机器学习实验的超参数、指标、产物和结果的过程,以确保可追溯性和可重复性。
个术语
模型注册表
集中式存储和管理机器学习模型版本及其元数据、部署状态和性能历史的系统。
个术语
可重复性
使用相同的数据、代码、参数和运行环境,能够精确重现机器学习实验的相同结果的能力。
个术语
制品仓库
用于存储机器学习制品的版本化存储系统,包括训练好的模型、预处理的数据集和其他二进制文件,并管理其元数据。
个术语
模型漂移检测
持续监控性能和数据分布的过程,用于识别由于数据模式变化导致的模型性能退化。
个术语
机器学习的持续集成 (CI/ML)
每次提交时自动执行代码、数据和模型的验证测试,以确保ML管道中的质量和一致性。
个术语
持续训练
利用新数据定期自动重新训练模型,以应对数据模式的变化,保持模型的相关性。
个术语
模型监控
在生产环境中持续监控模型的预测、性能和输入分布,以检测异常并确保模型的正常运行。
个术语
数据溯源
完整记录ML管道中使用的数据来源、历史记录和转换过程,对审计和合规性至关重要。
个术语
语义版本控制
模型版本的编号约定(X.Y.Z),其中X表示重大变更,Y表示功能添加,Z表示小幅修正。
个术语
湖仓架构
结合数据湖灵活性与数据仓库结构化管理的混合架构,用于优化ML数据版本管理和分析。
个术语
模型基线
用作比较点的参考模型或初始版本,用于评估改进或检测新版本中的回归。
🔍