Ataques Adversariais e Defesa

📂

subcategorias

Ataques White-Box

Ataques onde o adversário conhece completamente a arquitetura e os parâmetros do modelo alvo.

15 termos

📂

subcategorias

Ataques Black-Box

Ataques realizados sem conhecimento interno do modelo, apenas por interações com suas entradas/saídas.

18 termos

📂

subcategorias

Ataques por Evasão

Perturbações sutis dos dados de entrada para enganar o modelo durante a inferência.

13 termos

📂

subcategorias

Ataques por Envenenamento

Injeção de dados maliciosos no conjunto de treinamento para comprometer o modelo.

17 termos

📂

subcategorias

Ataques por Extração de Modelo

Roubo dos parâmetros ou da funcionalidade de um modelo proprietário por meio de requisições repetidas.

17 termos

📂

subcategorias

Ataques por Inferência de Pertença

Determinação se um ponto de dados específico fazia parte do conjunto de treinamento.

11 termos

📂

subcategorias

Defesa por Treinamento Adversarial

Treinamento do modelo em exemplos adversariais gerados para melhorar sua robustez.

15 termos

📂

subcategorias

Defesa por Detecção de Ataques

Mecanismos para identificar e rejeitar entradas potencialmente adversárias.

18 termos

📂

subcategorias

Defesa por Mascaramento de Gradiente

Técnicas que mascaram os gradientes para prevenir ataques baseados em otimização.

17 termos

📂

subcategorias

Ataques em Visão Computacional

Ataques especificamente projetados para enganar modelos de classificação de imagens e detecção de objetos.

8 termos

📂

subcategorias

Ataques em PNL

Perturbações textuais sutis para enganar modelos de processamento de linguagem natural.

17 termos

📂

subcategorias

Ataques por Transferência

Ataques gerados em um modelo fonte, mas eficazes contra diferentes modelos alvo.

16 termos

📂

subcategorias

Defesa por Randomização

Introdução de estocasticidade no processo de inferência para perturbar os ataques.

16 termos

📂

subcategorias

Ataques a Modelos de Áudio

Perturbações sonoras imperceptíveis projetadas para enganar sistemas de reconhecimento de voz.

20 termos

📂

subcategorias

Avaliação de Robustez

Métricas e benchmarks para quantificar a resistência dos modelos a ataques adversariais.

17 termos

Glossário IA

Ataques White-Box

Ataques Black-Box

Ataques por Evasão

Ataques por Envenenamento

Ataques por Extração de Modelo

Ataques por Inferência de Pertença

Defesa por Treinamento Adversarial

Defesa por Detecção de Ataques

Defesa por Mascaramento de Gradiente

Ataques em Visão Computacional

Ataques em PNL

Ataques por Transferência

Defesa por Randomização

Ataques a Modelos de Áudio

Avaliação de Robustez

Nenhum resultado encontrado