Glossário IA
O dicionário completo da Inteligência Artificial
Roubo de Parâmetros
Processo pelo qual um atacante recupera os pesos e vieses de uma rede neural treinada para recriar uma cópia funcional do modelo original sem acesso direto aos arquivos.
Extração de Funcionalidade
Método que consiste em deduzir as características de aprendizado e as representações internas de um modelo observando seus comportamentos diante de diversas entradas.
Consultas Adversariais
Conjunto de entradas especificamente projetadas para sondar os limites e comportamentos de um modelo com o objetivo de extrair informações sensíveis sobre sua arquitetura ou seus parâmetros.
Inferência de Modelo
Processo de dedução das propriedades de um modelo alvo (arquitetura, hiperparâmetros, dados de treinamento) a partir de suas previsões e respostas às consultas.
Shadow Modeling
Técnica onde o atacante treina vários modelos substitutos para aproximar o comportamento do modelo alvo, facilitando subsequentemente a extração de suas características internas.
Inferência de Membros
Ataque que visa determinar se uma amostra de dados específica fazia parte do conjunto de treinamento de um modelo, frequentemente usada como etapa preliminar à extração.
Ataque Baseado em Consulta
Estratégia de ataque que se baseia exclusivamente no envio de consultas à API de um modelo para deduzir progressivamente sua estrutura e seus parâmetros internos.
Ataque de Extração de Função
Ataque especializado que visa reproduzir a função de decisão de um modelo, em vez de seus parâmetros exatos, criando um modelo aproximado com um comportamento equivalente.
Extração de Parâmetros
Técnica avançada que permite recuperar os valores numéricos exatos dos pesos de uma rede neural a partir de observações de suas saídas para diferentes entradas.
Abuso de API
Exploração abusiva dos pontos de acesso de um serviço de IA para realizar um número excessivo de requisições com o objetivo de extrair informações sobre o modelo subjacente.
Inversão de Modelo
Ataque reconstrutivo onde o atacante usa as saídas de um modelo para reconstruir aproximadamente os dados de treinamento sensíveis que foram usados para seu aprendizado.
Ataque de Destilação de Conhecimento
Uso malicioso de técnicas de destilação de conhecimento onde o modelo alvo se torna o professor e o atacante cria um modelo aluno que imita seu comportamento.
Impressão Digital de Modelo
Identificação única de um modelo por suas características comportamentais distintivas, permitindo rastrear sua proveniência e facilitar sua extração direcionada.
Extração White-box
Ataque onde o atacante tem acesso parcial ou completo à arquitetura do modelo, facilitando grandemente a extração precisa de seus parâmetros e funcionalidades.
Extração Black-box
Extração de modelo realizada sem conhecimento prévio da arquitetura interna, baseando-se unicamente nas relações entrada-saída observadas via API.
Ataque Oráculo
Método de ataque que trata o modelo alvo como um oráculo que fornece respostas a perguntas, usando essas respostas para reconstruir progressivamente sua lógica interna.
Análise do Espaço de Saída
Análise sistemática do espaço de saída de um modelo para identificar padrões e relações que permitam deduzir sua estrutura interna e seus parâmetros.