Expert
Scalabilité Haute Disponibilité de Prometheus
Architecture pour scaler Prometheus afin de gérer des millions de métriques sans perte de données.
📝 Prompt Inhoud
Notre instance Prometheus unique écrase le disque et le CPU lors des 'scrapes' de haute cardinalité. Propose une architecture de scalabilité pour un cluster Kubernetes de taille significative (plus de 5000 nœuds).
Ta réponse doit couvrir :
1. Le sharding du scraping (par exemple, utilisez 'relabel_configs' pour distribuer la charge).
2. La mise en place d'un stockage à long terme (Thanos ou Cortex) pour la rétention infinie et l'interrogation fédérée.
3. La configuration de la Haute Disponibilité (HA) pour éviter les trous de données en cas de crash d'un réplicat.
4. Des exemples précis de fichiers de configuration (prometheus.yml).