Glossário IA
O dicionário completo da Inteligência Artificial
Detecção de Anomalias Adversariais
Processo de identificação de amostras maliciosas projetadas para enganar modelos de IA, analisando as divergências estatísticas em relação aos dados legítimos. Este método utiliza técnicas de aprendizado não supervisionado para detectar padrões anormais no espaço de características.
Classificador Binário de Detecção
Modelo de machine learning treinado especificamente para distinguir entradas normais de entradas potencialmente adversariais antes de passarem para o modelo principal. Este sistema atua como uma primeira linha de defesa, filtrando proativamente amostras suspeitas.
Limiar de Confiança Adversarial
Valor crítico de confiança predefinido usado para rejeitar previsões quando o modelo apresenta uma incerteza anormalmente alta ou baixa. As entradas adversariais frequentemente causam distribuições de probabilidade atípicas que este limiar permite identificar.
Detecção por Reconstrução de Autoencoder
Técnica que utiliza autoencoders treinados em dados legítimos para detectar ataques baseados no alto erro de reconstrução de amostras adversariais. As entradas maliciosas geralmente apresentam erros de reconstrução significativamente superiores aos dados normais.
Detecção por Divergência de Distribuição
Método que analisa os desvios entre a distribuição das entradas testadas e a dos dados de treinamento para identificar amostras potencialmente corrompidas. Esta abordagem baseia-se no princípio de que os ataques adversariais criam distribuições anormais no espaço latente.
Pontuação de Detecção Adversarial
Métrica quantitativa que avalia a probabilidade de uma entrada ser adversarial com base em múltiplos indicadores, como a magnitude do gradiente e a sensibilidade do modelo. Esta pontuação composta permite uma decisão matizada sobre a natureza maliciosa ou legítima de uma amostra.
Detecção por Análise de Gradiente
Técnica que examina as características do gradiente da função de perda para identificar perturbações adversariais sutis. Os ataques frequentemente geram gradientes com propriedades estatísticas distintivas detectáveis por este método.
Sistema de Detecção em Cascata
Arquitetura multinível onde vários detectores especializados são executados sequencialmente para identificar diferentes tipos de ataques adversariais. Cada nível filtra progressivamente as ameaças, minimizando os falsos positivos em dados legítimos.
Detecção por Distância de Mahalanobis
Medida estatística que avalia o afastamento de uma amostra em relação à distribuição dos dados legítimos no espaço de características. Os pontos distantes de acordo com esta métrica ponderada são suscetíveis de serem ataques adversariais.
Validação de Coerência Semântica
Processo que verifica a coerência lógica entre as características de uma entrada para detectar inconsistências introduzidas por ataques. As amostras adversariais frequentemente apresentam contradições semânticas sutis entre diferentes partes dos dados.
Detecção por Aprendizagem Meta
Abordagem onde um meta-modelo aprende a reconhecer padrões de ataques treinando-se em diversos tipos de exemplos adversariais gerados por diferentes métodos. Esta técnica oferece uma generalização aprimorada frente a ataques desconhecidos.
Calibração de Defesa Adversarial
Processo de ajuste dos parâmetros de detecção para otimizar o compromisso entre taxa de detecção e taxa de falsos positivos de acordo com o contexto de aplicação. A calibração garante uma proteção eficaz sem degradar excessivamente o desempenho em dados legítimos.
Detecção por Análise de Sensibilidade
Método que avalia como pequenas perturbações afetam a saída do modelo para identificar entradas anormalmente sensíveis. As amostras adversariais geralmente mostram uma sensibilidade desproporcional em comparação com dados normais.
Sistema de Defesa Híbrida
Combinação de múltiplas técnicas de detecção complementares para melhorar a robustez global contra diversos tipos de ataques adversariais. Esta abordagem sinérgica explora as forças de cada método, ao mesmo tempo que compensa suas respectivas fraquezas.
Detecção por Validação de Manifold
Técnica que verifica se uma amostra se situa no manifold de dados legítimos aprendido durante o treinamento do modelo. Os ataques adversariais frequentemente criam pontos que se desviam significativamente deste manifold de dados.
Limiar de Detecção Dinâmico
Mecanismo adaptativo que ajusta automaticamente os limiares de detecção com base nas características dos dados em tempo real para otimizar o desempenho. Esta abordagem mantém uma eficácia constante frente a distribuições de dados evolutivas.
Detecção por Análise de Perturbação
Método que identifica padrões de perturbação característicos de ataques adversariais, analisando as modificações aplicadas às entradas originais. Esta técnica foca na estrutura das mudanças, em vez dos valores absolutos.
Detecção por Análise de Consistência
Técnica que verifica a consistência das previsões do modelo sob diferentes transformações ou condições para identificar comportamentos adversariais. Os ataques frequentemente provocam inconsistências reveladoras sob variações menores da entrada.