Ataques de extracción de modelos

📖

términos

Robo de Parámetros

Proceso por el cual un atacante recupera los pesos y sesgos de una red neuronal entrenada para recrear una copia funcional del modelo original sin acceso directo a los archivos.

📖

términos

Extracción de Características

Método que consiste en deducir las características de aprendizaje y las representaciones internas de un modelo observando sus comportamientos ante diversas entradas.

📖

términos

Consultas Adversarias

Conjunto de entradas específicamente diseñadas para sondear los límites y comportamientos de un modelo con el objetivo de extraer información sensible sobre su arquitectura o sus parámetros.

📖

términos

Inferencia de Modelo

Proceso de deducción de las propiedades de un modelo objetivo (arquitectura, hiperparámetros, datos de entrenamiento) a partir de sus predicciones y respuestas a las consultas.

📖

términos

Modelado Sombra

Técnica en la que el atacante entrena varios modelos sustitutos para aproximar el comportamiento del modelo objetivo, facilitando posteriormente la extracción de sus características internas.

📖

términos

Inferencia de Pertenencia

Ataque que tiene como objetivo determinar si una muestra de datos específica formaba parte del conjunto de entrenamiento de un modelo, a menudo utilizada como paso preliminar a la extracción.

📖

términos

Ataque Basado en Consultas

Estrategia de ataque que se basa exclusivamente en el envío de consultas a la API de un modelo para deducir progresivamente su estructura y sus parámetros internos.

📖

términos

Ataque de Extracción de Función

Ataque especializada que tiene como objetivo reproducir la función de decisión de un modelo en lugar de sus parámetros exactos, creando un modelo aproximativo con un comportamiento equivalente.

📖

términos

Extracción de parámetros

Técnica avanzada que permite recuperar los valores numéricos exactos de los pesos de una red neuronal a partir de observaciones de sus salidas para diferentes entradas.

📖

términos

Abuso de API

Explotación abusiva de los puntos de acceso de un servicio de IA para realizar un número excesivo de solicitudes con el fin de extraer información sobre el modelo subyacente.

📖

términos

Inversión de modelo

Ataque reconstructivo donde el atacante utiliza las salidas de un modelo para reconstruir aproximadamente los datos de entrenamiento sensibles que sirvieron para su aprendizaje.

📖

términos

Ataque de destilación de conocimientos

Uso malintencionado de las técnicas de destilación de conocimientos donde el modelo objetivo se convierte en el maestro y el atacante crea un modelo estudiante que imita su comportamiento.

📖

términos

Huella digital de modelo

Identificación única de un modelo por sus características conductuales distintivas, permitiendo rastrear su procedencia y facilitar su extracción selectiva.

📖

términos

Extracción de caja blanca

Ataque donde el atacante tiene un acceso parcial o completo a la arquitectura del modelo, facilitando enormemente la extracción precisa de sus parámetros y funcionalidades.

📖

términos

Extracción de caja negra

Extracción de modelo realizada sin conocimiento previo de la arquitectura interna, basándose únicamente en las relaciones entrada-salida observadas a través de la API.

📖

términos

Ataque de oráculo

Método de ataque que trata el modelo objetivo como un oráculo que proporciona respuestas a preguntas, utilizando estas respuestas para reconstruir progresivamente su lógica interna.

📖

términos

Análisis del espacio de salida

Análisis sistemático del espacio de salida de un modelo para identificar patrones y relaciones que permitan deducir su estructura interna y sus parámetros.

Glosario IA

Robo de Parámetros

Extracción de Características

Consultas Adversarias

Inferencia de Modelo

Modelado Sombra

Inferencia de Pertenencia

Ataque Basado en Consultas

Ataque de Extracción de Función

Extracción de parámetros

Abuso de API

Inversión de modelo

Ataque de destilación de conocimientos

Huella digital de modelo

Extracción de caja blanca

Extracción de caja negra

Ataque de oráculo

Análisis del espacio de salida

No se encontraron resultados