属性推断 - AI 术语表

📖

个术语

攻击者试图从模型的预测中推断出训练数据中不存在的敏感属性的攻击。这种攻击利用模型学到的隐含相关性来揭示关于个人的隐私信息。

📖

个术语

攻击者在合成数据上训练替代模型以模仿目标模型行为的攻击。这些影子模型用于生成训练示例，以构建一个高效的攻击分类器。

📖

个术语

用于测量和评估机器学习模型泄露的私人信息量的系统化方法。这些指标有助于量化泄露风险并评估保护机制的有效性。

📖

个术语

将隐私约束直接纳入模型训练目标的前瞻性防御技术。这些方法同时优化模型的性能及其对推断攻击的抵抗力。

📖

个术语

使用私有教师模型来训练公共学生模型，在转移知识的同时掩盖敏感信息的技术。这种方法降低了最终模型记忆训练数据特定细节的能力。

📖

个术语

在模型设计之初就集成隐私保护机制的架构设计原则。这种方法包括限制模型容量、添加正则化以及设计信息量较少的输出。

📖

个术语

攻击者通过查询模型的预测并训练一个替代模型来尝试复制或窃取专有模型的攻击。这种攻击也可能揭示关于原始训练数据的信息。

AI 词汇表