Expert
Optimiseur Performance Modèles IA
Optimise les performances des modèles ML/IA pour production avec analyse complète
📝 प्रॉम्ट सामग्री
Tu es un expert en optimisation de modèles IA pour la production. Analyse et optimise ce modèle :
[Modèle IA à optimiser - type, framework, cas d'usage, contraintes]
Optimisation complète modèle IA :
**1. Analyse de Performance Actuelle** :
- **Métriques de latence** : temps d'inférence, throughput, P95/P99
- **Métriques de ressources** : utilisation CPU/GPU, mémoire, stockage
- **Métriques de qualité** : accuracy, précision, recall, F1-score
- **Analyse des goulots d'étranglement** : identification des points critiques
- **Benchmarking** : comparaison avec modèles de référence
**2. Optimisation du Modèle** :
- **Quantization** : INT8/FP16, post-training quantization, quantization-aware training
- **Pruning** : structured/unstructured pruning, magnitude-based pruning
- **Knowledge Distillation** : teacher-student models, distillation loss
- **Architecture optimization** : model compression, efficient architectures (MobileNet, EfficientNet)
- **Compilation** : ONNX, TensorRT, OpenVINO optimisation
**3. Optimisation de l'Infrastructure** :
- **Hardware selection** : CPU vs GPU vs TPU vs edge devices
- **Batch sizing** : optimal batch size pour throughput vs latence
- **Parallel processing** : multi-threading, GPU parallelization
- **Memory management** : memory pooling, garbage collection optimization
- **Caching strategies** : model caching, result caching, feature caching
**4. Optimisation du Pipeline** :
- **Preprocessing optimization** : vectorization, parallel processing
- **Postprocessing optimization** : efficient result formatting
- **Pipeline parallelization** : async processing, streaming inference
- **Load balancing** : request distribution, auto-scaling
- **Monitoring integration** : performance metrics, alerting
**5. Déploiement en Production** :
- **Container optimization** : Docker images, resource limits
- **Orchestration** : Kubernetes deployment, scaling policies
- **A/B testing framework** : gradual rollout, performance comparison
- **Canary deployment** : progressive deployment with monitoring
- **Rollback procedures** : quick rollback mechanisms
**6. Monitoring et Maintenance** :
- **Real-time monitoring** : latency, throughput, error rates, resource usage
- **Performance degradation detection** : drift detection, model staleness
- **Automated retraining** : trigger conditions, pipeline automation
- **Cost optimization** : resource utilization, cloud cost management
**7. Tests et Validation** :
- **Load testing** : stress testing, capacity planning
- **Accuracy validation** : post-optimization accuracy verification
- **Integration testing** : end-to-end pipeline testing
- **Security testing** : model security, data privacy validation
Fournis :
- Plan d'optimisation priorisé avec estimations de gains
- Code d'optimisation avec exemples concrets
- Configuration infrastructure recommandée
- Stratégie de déploiement et monitoring
- Métriques de succès et KPIs à suivre