Seguridad de Modelos - Glosario IA

📖

términos

Inferencia de Pertenencia

Tipo de ataque a la privacidad donde un adversario determina si un registro de datos específico se ha utilizado en el conjunto de entrenamiento de un modelo, violando la privacidad de los individuos.

📖

términos

Ataque por Inversión

Ataque que reconstruye aproximadamente los datos de entrenamiento sensibles analizando las salidas del modelo, amenazando la confidencialidad de la información utilizada para su aprendizaje.

📖

términos

Privacidad Diferencial

Marco formal de privacidad que garantiza que la salida de un modelo cambia de manera insignificante si un solo individuo se añade o elimina del conjunto de datos de entrenamiento.

📖

términos

Defensa por Enmascaramiento de Gradiente

Técnica de protección que busca oscurecer los gradientes del modelo para impedir que los atacantes utilicen métodos basados en gradientes para generar ataques adversariales eficaces.

📖

términos

Aprendizaje Federado

Enfoque de entrenamiento descentralizado donde el modelo se aprende sobre datos locales sin compartirlos, reduciendo el riesgo de fugas de datos sensibles desde un repositorio central.

📖

términos

Backdoor en un Modelo

Vulnerabilidad introducida intencionadamente en un modelo, a menudo mediante un envenenamiento de datos, que le hace comportarse anormalmente en presencia de un disparador específico.

📖

términos

Robustez del Modelo

Capacidad de un modelo de machine learning para mantener su rendimiento frente a perturbaciones de los datos de entrada, incluyendo los ruidos aleatorios y los ataques adversariales dirigidos.

📖

términos

Certificación de Robustez

Proceso matemático que proporciona una garantía formal de que un modelo no puede ser engañado por perturbaciones de entrada que superen una determinada magnitud definida.

📖

términos

Ataque de Transferibilidad

Fenómeno donde un ejemplo adversarial, diseñado para engañar a un modelo específico, también logra inducir a error a otros modelos con arquitecturas o datos de entrenamiento diferentes.

📖

términos

Limpieza de Conjunto de Datos

Proceso proactivo de identificación y eliminación de muestras potencialmente maliciosas o anormales de un conjunto de datos antes del entrenamiento para prevenir ataques de tipo envenenamiento.

📖

términos

Métrica de Sensibilidad

Medida cuantitativa que evalúa cuánto cambian las predicciones de un modelo en respuesta a pequeñas modificaciones de sus datos de entrada, indicando su vulnerabilidad a los ataques.

Glosario IA

Inferencia de Pertenencia

Ataque por Inversión

Privacidad Diferencial

Defensa por Enmascaramiento de Gradiente

Aprendizaje Federado

Backdoor en un Modelo

Robustez del Modelo

Certificación de Robustez

Ataque de Transferibilidad

Limpieza de Conjunto de Datos

Métrica de Sensibilidad

No se encontraron resultados