Glossário IA
O dicionário completo da Inteligência Artificial
Ataque Adversária
Manipulação intencional dos dados de entrada para enganar um modelo de IA e provocar erros de classificação ou comportamentos inesperados. Esses ataques exploram as vulnerabilidades matemáticas das redes neurais introduzindo perturbações imperceptíveis para humanos mas detectáveis pelo algoritmo.
Robustez Ética
Capacidade de um sistema de IA manter seus princípios éticos e comportamentos justos diante de tentativas de manipulação ou condições inesperadas. Ela garante a preservação dos valores morais do sistema mesmo sob estresse ou ataque algorítmico.
Defesa Contra-Adversária
Conjunto de técnicas visando fortalecer modelos de IA contra ataques adversários, incluindo treinamento adversarial, detecção de anomalias e purificação de entradas. Esses métodos visam manter a integridade funcional e ética do sistema diante de tentativas de subversão.
Envenenamento de Dados
Inserção maliciosa de dados corrompidos no conjunto de treinamento para comprometer o desempenho futuro do modelo e introduzir vieses sistêmicos. Esta técnica pode degradar intencionalmente as capacidades éticas e decisórias do sistema de IA.
Evasão de Modelo
Estratégia de ataque onde entradas especialmente criadas permitem contornar os mecanismos de detecção ou classificação de um modelo de IA. A evasão ameaça diretamente a robustez ética ao permitir a violação de regras e restrições morais estabelecidas.
Perturbação Ética
Modificação sutil de entradas ou parâmetros visando especificamente comprometer os mecanismos de decisão ética de um sistema de IA. Esses ataques visam as camadas de julgamento moral para induzir comportamentos não conformes aos valores programados.
Estabilidade Ética
Medida da consistência das decisões éticas de um sistema de IA diante de variações menores nas condições de entrada ou ambiente. A estabilidade garante que os julgamentos morais permaneçam constantes e previsíveis apesar das flutuações contextuais.
Resiliência Algorítmica
Capacidade de um sistema de IA se recuperar e manter seu desempenho ético após sofrer ataques ou perturbações importantes. A resiliência inclui mecanismos de autocorreção e adaptação para preservar a integridade moral a longo prazo.
Segurança Ética
Domínio da cibersegurança de IA especializado na proteção dos mecanismos de decisão ética contra manipulações e comprometimentos. Ela combina técnicas criptográficas, validação formal e monitoramento comportamental para garantir a integridade moral.
Vulnerabilidade Ética
Ponto fraco na arquitetura ou implementação de um sistema de IA que pode ser explorado para violar seus princípios éticos fundamentais. Essas vulnerabilidades podem residir nas camadas de decisão, validação ou controle moral do sistema.
Teste de Robustez
Avaliação sistemática da capacidade de um sistema de IA em manter seus comportamentos éticos diante de cenários extremos ou hostis. Esses testes simulam vários tipos de ataques e perturbações para identificar e corrigir fraquezas morais.
Validação Ética
Processo formal de verificação de que um sistema de IA respeita constantemente suas restrições éticas mesmo sob restrições adversas. A validação combina testes estatísticos, verificação formal e auditorias comportamentais para garantir a conformidade moral.
Contra-medida Ética
Mecanismo proativo ou reativo projetado para prevenir ou neutralizar tentativas de comprometimento dos princípios éticos de um sistema de IA. Essas contra-medidas incluem detecção de anomalias, isolamento decisório e recuperação ética.
Inferência Adversa
Processo pelo qual um atacante explora as vulnerabilidades de um modelo de IA para deduzir informações sensíveis ou forçar decisões antiéticas. A inferência adversa ameaça diretamente a confidencialidade e a integridade moral do sistema.
Robustez Distribucional
Capacidade de um sistema de IA manter seu desempenho ético diante de mudanças na distribuição dos dados de entrada ou das condições operacionais. Essa robustez garante a estabilidade das decisões morais apesar das derivas distribucionais.
Ataque por Extração
Técnica que visa reproduzir o comportamento de um modelo de IA, incluindo seus vieses e vulnerabilidades éticas, interrogando-o sistematicamente. Esses ataques podem revelar e explorar as fraquezas morais do sistema original.
Certificação Ética
Processo formal que atesta que um sistema de IA mantém suas garantias éticas em condições definidas, incluindo contra ataques. A certificação ética valida a robustez dos mecanismos de decisão moral segundo padrões reconhecidos.
Treinamento Adversarial
Método de treinamento onde o modelo aprende simultaneamente a resistir a ataques e a manter seus princípios éticos. Esta abordagem reforça a robustez expondo o sistema a cenários hostis durante seu aprendizado.