Glosario IA
El diccionario completo de la Inteligencia Artificial
Ataque de inferencia de atributos
Ataque donde un adversario intenta deducir atributos sensibles no presentes en los datos de entrenamiento a partir de las predicciones del modelo. Este ataque explota las correlaciones implícitas aprendidas por el modelo para revelar información privada sobre los individuos.
Ataque de modelo sombra
Ataque donde el adversario entrena modelos alternativos en datos sintéticos para imitar el comportamiento del modelo objetivo. Estos modelos fantasma permiten generar ejemplos de entrenamiento para construir un clasificador de ataque efectivo.
Cuantificación de fuga de privacidad
Métodos sistemáticos para medir y evaluar la cantidad de información privada divulgada por un modelo de aprendizaje automático. Estas métricas ayudan a cuantificar los riesgos de fugas y a evaluar la eficacia de los mecanismos de protección.
Defensa de privacidad adversarial
Técnicas de defensa proactivas que incorporan restricciones de confidencialidad directamente en el objetivo de entrenamiento del modelo. Estos métodos optimizan simultáneamente el rendimiento del modelo y su resistencia a los ataques de inferencia.
Destilación de conocimiento para privacidad
Técnica donde un modelo profesor privado se utiliza para entrenar un modelo estudiante público, transfiriendo conocimientos mientras se enmascara la información sensible. Este enfoque reduce la capacidad del modelo final para memorizar detalles específicos de los datos de entrenamiento.
Diseño de modelo consciente de la privacidad
Principios de diseño arquitectónico que integran mecanismos de protección de la privacidad desde el diseño del modelo. Este enfoque incluye la limitación de la capacidad del modelo, la adición de regularización y el diseño de salidas menos informativas.
Ataque de extracción de modelo
Ataque donde un adversario intenta replicar o robar un modelo propietario consultando sus predicciones y entrenando un modelo sustituto. Este ataque también puede revelar información sobre los datos de entrenamiento originales.