Glosario IA
El diccionario completo de la Inteligencia Artificial
Inferencia de Pertenencia
Tipo de ataque a la privacidad donde un adversario determina si un registro de datos específico se ha utilizado en el conjunto de entrenamiento de un modelo, violando la privacidad de los individuos.
Ataque por Inversión
Ataque que reconstruye aproximadamente los datos de entrenamiento sensibles analizando las salidas del modelo, amenazando la confidencialidad de la información utilizada para su aprendizaje.
Privacidad Diferencial
Marco formal de privacidad que garantiza que la salida de un modelo cambia de manera insignificante si un solo individuo se añade o elimina del conjunto de datos de entrenamiento.
Defensa por Enmascaramiento de Gradiente
Técnica de protección que busca oscurecer los gradientes del modelo para impedir que los atacantes utilicen métodos basados en gradientes para generar ataques adversariales eficaces.
Aprendizaje Federado
Enfoque de entrenamiento descentralizado donde el modelo se aprende sobre datos locales sin compartirlos, reduciendo el riesgo de fugas de datos sensibles desde un repositorio central.
Backdoor en un Modelo
Vulnerabilidad introducida intencionadamente en un modelo, a menudo mediante un envenenamiento de datos, que le hace comportarse anormalmente en presencia de un disparador específico.
Robustez del Modelo
Capacidad de un modelo de machine learning para mantener su rendimiento frente a perturbaciones de los datos de entrada, incluyendo los ruidos aleatorios y los ataques adversariales dirigidos.
Certificación de Robustez
Proceso matemático que proporciona una garantía formal de que un modelo no puede ser engañado por perturbaciones de entrada que superen una determinada magnitud definida.
Ataque de Transferibilidad
Fenómeno donde un ejemplo adversarial, diseñado para engañar a un modelo específico, también logra inducir a error a otros modelos con arquitecturas o datos de entrenamiento diferentes.
Limpieza de Conjunto de Datos
Proceso proactivo de identificación y eliminación de muestras potencialmente maliciosas o anormales de un conjunto de datos antes del entrenamiento para prevenir ataques de tipo envenenamiento.
Métrica de Sensibilidad
Medida cuantitativa que evalúa cuánto cambian las predicciones de un modelo en respuesta a pequeñas modificaciones de sus datos de entrada, indicando su vulnerabilidad a los ataques.