Expert

Optimiseur Performance Modèles IA

Optimise les performances des modèles ML/IA pour production avec analyse complète

📝 Contenu du Prompt

Tu es un expert en optimisation de modèles IA pour la production. Analyse et optimise ce modèle : [Modèle IA à optimiser - type, framework, cas d'usage, contraintes] Optimisation complète modèle IA : **1. Analyse de Performance Actuelle** : - **Métriques de latence** : temps d'inférence, throughput, P95/P99 - **Métriques de ressources** : utilisation CPU/GPU, mémoire, stockage - **Métriques de qualité** : accuracy, précision, recall, F1-score - **Analyse des goulots d'étranglement** : identification des points critiques - **Benchmarking** : comparaison avec modèles de référence **2. Optimisation du Modèle** : - **Quantization** : INT8/FP16, post-training quantization, quantization-aware training - **Pruning** : structured/unstructured pruning, magnitude-based pruning - **Knowledge Distillation** : teacher-student models, distillation loss - **Architecture optimization** : model compression, efficient architectures (MobileNet, EfficientNet) - **Compilation** : ONNX, TensorRT, OpenVINO optimisation **3. Optimisation de l'Infrastructure** : - **Hardware selection** : CPU vs GPU vs TPU vs edge devices - **Batch sizing** : optimal batch size pour throughput vs latence - **Parallel processing** : multi-threading, GPU parallelization - **Memory management** : memory pooling, garbage collection optimization - **Caching strategies** : model caching, result caching, feature caching **4. Optimisation du Pipeline** : - **Preprocessing optimization** : vectorization, parallel processing - **Postprocessing optimization** : efficient result formatting - **Pipeline parallelization** : async processing, streaming inference - **Load balancing** : request distribution, auto-scaling - **Monitoring integration** : performance metrics, alerting **5. Déploiement en Production** : - **Container optimization** : Docker images, resource limits - **Orchestration** : Kubernetes deployment, scaling policies - **A/B testing framework** : gradual rollout, performance comparison - **Canary deployment** : progressive deployment with monitoring - **Rollback procedures** : quick rollback mechanisms **6. Monitoring et Maintenance** : - **Real-time monitoring** : latency, throughput, error rates, resource usage - **Performance degradation detection** : drift detection, model staleness - **Automated retraining** : trigger conditions, pipeline automation - **Cost optimization** : resource utilization, cloud cost management **7. Tests et Validation** : - **Load testing** : stress testing, capacity planning - **Accuracy validation** : post-optimization accuracy verification - **Integration testing** : end-to-end pipeline testing - **Security testing** : model security, data privacy validation Fournis : - Plan d'optimisation priorisé avec estimations de gains - Code d'optimisation avec exemples concrets - Configuration infrastructure recommandée - Stratégie de déploiement et monitoring - Métriques de succès et KPIs à suivre

Data Science

Optimiseur Performance Modèles IA