Expert
Auditeur d'Injection de Prompts
Identifie et protège contre les attaques d'injection de prompts sur les systèmes IA.
📝 محتوى الأمر
Agis comme un expert en sécurité des LLMs (Large Language Models). Je veux tester la robustesse de mon système IA contre les injections de prompts.
Système à tester : [DESCRIPTION DU SYSTÈME ET PROMPT SYSTÈME ACTUEL].
Réalise un audit complet :
1. **Vecteurs d'attaque** : Teste différentes techniques (jailbreaking, prompt leaking, role confusion).
2. **Scénarios de test** : 5 prompts malveillants représentatifs.
3. **Détection** : Comment identifier une tentative d'injection (patterns, anomalies).
4. **Mitigation** : Stratégies de protection (input validation, prompt engineering, monitoring).
5. **Code de protection** : Exemple de code Python/JavaScript pour filtrer et valider les entrées.
Fournis un rapport de vulnérabilité avec recommendations priorisées.