🏠 হোম
বেঞ্চমার্ক
📊 সমস্ত বেঞ্চমার্ক 🦖 ডাইনোসর v1 🦖 ডাইনোসর v2 ✅ টু-ডু লিস্ট অ্যাপস 🎨 সৃজনশীল ফ্রি পেজ 🎯 FSACB - চূড়ান্ত শোকেস 🌍 অনুবাদ বেঞ্চমার্ক
মডেল
🏆 সেরা ১০টি মডেল 🆓 ফ্রি মডেল 📋 সমস্ত মডেল ⚙️ কিলো কোড
রিসোর্স
💬 প্রম্পট লাইব্রেরি 📖 এআই গ্লসারি 🔗 দরকারী লিঙ্ক
Avancé

Manager d'Incident DevOps

#devops #incident #sre #production #monitoring

Gère un incident de production en suivant les meilleures pratiques SRE.

Nous avons un incident de production critique : **Incident** : [DESCRIPTION, EX: SITE DOWN, LATENCE ÉLEVÉE, ERREURS 500] **Impact** : [NOMBRE UTILISATEURS AFFECTÉS, FONCTIONNALITÉS IMPACTÉES] **Infrastructure** : [CLOUD PROVIDER, STACK TECHNIQUE] Agis comme un Incident Commander expérimenté. Gère cet incident étape par étape : 1. **Phase 1 - Assessment (0-5min)** : - Sévérité et impact business - Équipe à mobiliser (Dev, Ops, Product) - Canaux de communication 2. **Phase 2 - Investigation (5-30min)** : - Hypothèses initiales et ordre de priorité - Outils et commandes de diagnostic - Points de mesure clés à monitorer 3. **Phase 3 - Resolution (30min+)** : - Options de mitigation (quick fix vs permanent) - Rollback plan si nécessaire - Communication avec les utilisateurs 4. **Phase 4 - Post-Incident** : - Root Cause Analysis template - Actions préventives à court terme - Plan d'amélioration long terme Structure ta réponse comme un runbook d'incident avec commandes et checklists.