伦理鲁棒性 - AI 詞彙表

📖

術語

Attaque Adversaire

Manipulation intentionnelle des données d'entrée pour tromper un modèle IA et provoquer des erreurs de classification ou des comportements imprévus. Ces attaques exploitent les vulnérabilités mathématiques des réseaux de neurones en introduisant des perturbations imperceptibles pour l'humain mais détectables par l'algorithme.

📖

術語

Robustesse Éthique

Capacité d'un système IA à maintenir ses principes éthiques et ses comportements justes face aux tentatives de manipulation ou aux conditions inattendues. Elle garantit la préservation des valeurs morales du système même sous stress ou attaque algorithmique.

📖

術語

Défense Contre-Adversaire

Ensemble de techniques visant à renforcer les modèles IA contre les attaques adverses, incluant l'entraînement adversarial, la détection d'anomalies et la purification des entrées. Ces méthodes visent à maintenir l'intégrité fonctionnelle et éthique du système face aux tentatives de subversion.

📖

術語

Poisoning des Données

Insertion malveillante de données corrompues dans l'ensemble d'entraînement pour compromettre les performances futures du modèle et introduire des biais systémiques. Cette technique peut dégrader intentionnellement les capacités éthiques et décisionnelles du système IA.

📖

術語

Évasion Modèle

Stratégie d'attaque où des entrées spécialement craftées permettent de contourner les mécanismes de détection ou de classification d'un modèle IA. L'évasion menace directement la robustesse éthique en permettant la violation des règles et contraintes morales établies.

📖

術語

Perturbation Éthique

Modification subtile des entrées ou paramètres visant spécifiquement à compromettre les mécanismes de décision éthique d'un système IA. Ces attaques ciblent les couches de jugement moral pour induire des comportements non conformes aux valeurs programmées.

📖

術語

Stabilité Éthique

Mesure de la cohérence des décisions éthiques d'un système IA face à des variations mineures des conditions d'entrée ou d'environnement. La stabilité garantit que les jugements moraux restent constants et prévisibles malgré les fluctuations contextuelles.

📖

術語

Résilience Algorithmique

Capacité d'un système IA à récupérer et maintenir ses performances éthiques après avoir subi des attaques ou des perturbations importantes. La résilience inclut des mécanismes d'auto-correction et d'adaptation pour préserver l'intégrité morale à long terme.

📖

術語