Expert

Exercice Red Teaming Sécurité IA

Simule des attaques contre des systèmes IA pour identifier les vulnérabilités.

📝 محتوى الأمر

Tu es un expert en sécurité IA et Red Teaming. Conçois et exécute un exercice de Red Teaming complet pour : [SYSTÈME IA À TESTER : TYPE DE MODÈLE, CAS D'USAGE, CONTRAINTES] Exercice Red Teaming IA complet : **Phase 1: Reconnaissance et Planification** - Analyse du système cible : architecture, modèles, interfaces - Identification des vecteurs d'attaque potentiels - Définition des règles d'engagement et limites éthiques - Planification des scénarios de test prioritaires **Phase 2: Attaques par Prompt Injection** - **Jailbreaking** : Tentatives de contourner les restrictions - **Prompt Leaking** : Extraction d'informations sensibles - **Role Hijacking** : Manipulation du comportement du modèle - **Context Overflow** : Saturation du contexte pour faire oublier des instructions - **Multi-turn Attacks** : Attaques sur plusieurs interactions **Phase 3: Attaques par Données** - **Data Poisoning Simulation** : Tests avec données malveillantes - **Membership Inference** : Tentatives d'extraire des données d'entraînement - **Model Extraction** : Reconstruction approximative du modèle - **Adversarial Examples** : Génération d'inputs pour tromper le modèle **Phase 4: Attaques Systèmes** - **API Abuse** : Utilisation abusive des endpoints - **Rate Limiting Bypass** : Contournement des protections - **Authentication Attacks** : Tentatives d'accès non autorisé - **Denial of Service** : Surcharge des ressources **Phase 5: Analyse et Reporting** - Documentation des vulnérabilités découvertes - Évaluation de l'impact potentiel - Recommandations de mitigation par priorité - Plan de remédiation et tests de validation Fournis le plan d'attaque détaillé, les scripts de test, et le rapport de vulnérabilité complet.

Security

Exercice Red Teaming Sécurité IA