Glossário IA
O dicionário completo da Inteligência Artificial
Robustez por Transferência
Capacidade de um modelo de resistir a ataques adversariais inicialmente concebidos para outras arquiteturas, medindo a generalização das defesas contra ameaças desconhecidas.
Modelo Fonte
Modelo de referência utilizado para gerar ataques adversariais no contexto de ataques por transferência, servindo como ponto de partida para comprometer modelos alvo.
Modelo Alvo
Modelo vítima visado por um ataque por transferência, cujas vulnerabilidades são exploradas através de perturbações geradas num modelo fonte distinto.
Espaço de Ataque
Domínio matemático que define todas as perturbações possíveis que podem ser aplicadas aos dados de entrada para comprometer um modelo, crucial para avaliar a transferibilidade dos ataques.
Generalização de Ataque
Propriedade de um ataque adversarial de manter a sua eficácia em vários modelos ou instâncias do mesmo modelo, independentemente da sua arquitetura ou parâmetros específicos.
Método de Ensemble
Estratégia de ataque que combina vários modelos fonte para gerar perturbações mais robustas e transferíveis, aumentando significativamente a taxa de sucesso contra alvos desconhecidos.
Ataque No-Box
Tipo de ataque por transferência extremo onde o atacante não dispõe de qualquer informação sobre o modelo alvo, baseando-se unicamente na transferibilidade universal das perturbações.
Distância Normal
Medida matemática (L0, L1, L2, L∞) que quantifica a amplitude das perturbações adversariais, essencial para avaliar a transferibilidade mantendo a impercetibilidade do ataque.
Limite de Transferibilidade
Limite teórico superior que quantifica a taxa de sucesso máxima de um ataque por transferência entre dois modelos, baseada em suas similaridades estruturais e funcionais.
Diversidade de Modelos
Medida de variação entre arquiteturas, parâmetros e conjuntos de dados de treinamento de diferentes modelos, influenciando diretamente a transferibilidade dos ataques adversariais.
Alinhamento de Gradientes
Similaridade direcional entre os gradientes de diferentes modelos, servindo como um indicador preditivo da transferibilidade potencial dos ataques entre esses modelos.
Defesa por Transferência
Abordagem defensiva que explora a transferibilidade dos ataques para desenvolver proteções robustas que funcionam contra ameaças desconhecidas e futuros modelos de ataque.
Evasão de Modelo
Objetivo dos ataques por transferência que consiste em contornar os mecanismos de detecção ou classificação de um modelo sem ser detectado, explorando suas fraquezas generalizadas.
Superfície de Decisão
Fronteira matemática que separa as diferentes classes de predição de um modelo, cuja similaridade entre modelos determina o sucesso potencial dos ataques por transferência.
Sensibilidade por Transferência
Medida quantitativa da vulnerabilidade compartilhada entre diferentes modelos diante das mesmas perturbações adversariais, reveladora de fraquezas sistêmicas na aprendizagem automática.
Métrica de Transferibilidade
Indicador quantitativo que avalia a probabilidade de sucesso de um ataque gerado em um modelo fonte para comprometer um modelo alvo, baseado em similaridades estruturais ou comportamentais.