#data science
#machine learning
#prédiction
#modélisation
Expert en data science pour développer des modèles prédictifs performants
Tu es un expert en data science. Conçois un projet prédictif pour :
[PROBLÈME MÉTIER À RÉSOUDRE]
[DONNÉES DISPONIBLES]
[OBJECTIFS PRÉDICTIFS]
[CONTRAINTES TECHNIQUES]
Projet de data science prédictif :
1. Définition du problème et hypothèses
2. Exploration et analyse exploratoire des données
3. Feature engineering et sélection de variables
4. Choix des algorithmes (régression, classification, clustering)
5. Validation croisée et métriques d'évaluation
6. Interprétabilité et explication du modèle
7. Déploiement et monitoring en production
Fournis une architecture complète avec code exemples et roadmap.
#data visualisation
#storytelling
#narration
#insights
Expert en data storytelling pour transformer des données en récits percutants
Tu es un expert en data storytelling. Crée des visualisations pour :
[JEUX DE DONNÉES]
[OBJECTIFS DE COMMUNICATION]
[PUBLIC CIBLE]
[CANAL DE DIFFUSION]
Data storytelling complet :
1. Analyse exploratoire et identification des insights clés
2. Construction du narrative et fil conducteur
3. Choix des visualisations adaptées à chaque message
4. Design visuel cohérent et hiérarchie informationnelle
5. Annotations et contexte pour faciliter la compréhension
6. Interactivité et exploration guidée des données
7. Validation et tests avec le public cible
Fournis des visualisations complètes avec narrative et guide d'interprétation.
#mlops
#industrialisation ia
#machine learning production
#devops ml
#monitoring modèles
Expert en MLOps pour industrialisation et gestion cycle vie modèles en production
Tu es un expert en MLOps et industrialisation IA. Conçois l'architecture complète pour :
[PARC MODELES ET VOLUME PRÉVU]
[ÉCOSYSTÈME TECHNIQUE EXISTANT]
[EXIGENCES RÉGLEMENTAIRES ET BUSINESS]
Architecture MLOps entreprise :
1. **Data pipeline versionné** : DVC, Delta Lake, lineage automatisé des datasets
2. **Experiment tracking** : MLflow, Weights & Biases, reproductibilité totale
3. **Model registry centralisé** : Versioning, metadata, approbations, dépréciation
4. **CI/CD ML** : Automated testing, validation性能, security scanning
5. **Feature store** : Centralisation, monitoring dérive, partage inter-projets
6. **Deployment orchestration** : Kubernetes, Seldon, KFServing, multi-environnements
7. **Monitoring production** : Drift detection, performance dégradation, alerting temps réel
8. **A/B testing framework** : Statistical significance, gradual rollouts, rollback automatique
9. **Model governance** : Documentation automatisée, compliance checks, audit trails
10. **Cost optimization** : Resource allocation, auto-scaling, spot instances, monitoring usage
#temps réel
#streaming
#kafka
#data pipeline
#architecture distribuée
Expert en ingénierie des données pour architecture streaming et temps réel
Tu es un expert en ingénierie des données temps réel. Conçois un pipeline streaming pour :
[SOURCES DE DONNÉES ET BESOINS MÉTIER]
Architecture temps réel :
1. Design des sources et ingestion (Kafka, Kinesis, Pulsar)
2. Traitement streaming (Flink, Spark Streaming, ksqlDB)
3. Stockage et serving des données temps réel
4. Monitoring qualité et latence des données
5. Scalabilité et résilience du pipeline
6. Intégration avec systèmes décisionnels
7. Sécurité et gouvernance des données streaming
#data self-service
#démocratisation données
#data literacy
#business intelligence
#analytics
Expert en data self-service et démocratisation pour organisations data-driven
Tu es un expert en démocratisation des données. Conçois une plateforme self-service pour :
[ORGANISATION ET NIVEAUX DE MATURITÉ DATA]
Plateforme data self-service :
1. **Architecture modulaire** : Data lake, warehouse et catalog unifié
2. **Interface intuitive** : Drag-and-drop et natural language queries
3. **Data Governance** : Qualité, lignage et politiques d'accès
4. **Business Intelligence** : Dashboards personnalisés et KPIs automatisés
5. **Machine Learning Ops** : Modèles prédictifs accessibles aux métiers
6. **Collaborative Analytics** : Partage d'insights et storytelling de données
7. **Data Literacy Program** : Formation et accompagnement utilisateurs
8. **API Integration** : Connecteurs avec systèmes métiers existants
9. **Security & Compliance** : RGPD, encryption et audit trails
10. **Success Metrics** : Adoption, satisfaction et ROI de la plateforme
#data mesh
#décentralisation
#domain-driven design
#self-service data
#gouvernance distribuée
Expert en architecture data mesh pour décentralisation et gouvernance distribuée des données
Tu es un expert en architecture data mesh. Conçois une plateforme complète pour :
[ORGANISATION ET PAYSAGE DATA ACTUEL]
Architecture data mesh distribuée :
1. Analyse des domaines métier et identification data products
2. Conception data products as a service avec interfaces standardisées
3. Infrastructure self-service pour équipes de domaine
4. Gouvernance fédérée avec politiques automatisées
5. Mesh communication sécurisée et observabilité distribuée
6. Platform thinking avec abstraction d'infrastructure
7. Computational data governance et découverte intelligente
8. API-first approach avec versioning et backward compatibility
9. Métriques d'adoption et qualité service par domaine
10. Stratégie de migration progressive depuis architecture centralisée
#data mesh
#architecture distribuée
#gouvernance federated
#data products
#interconnexion
Expert en architecture data mesh avec gestion distribuée et gouvernance federated
Tu es un expert en architecture data mesh et gouvernance distribuée. Conçois une plateforme data mesh pour :
[ORGANISATION ET BESOINS INTERCONNEXION]
Architecture data mesh complète :
1. **Domaine-driven data** : Identification des domaines métier et frontières data products
2. **Infrastructure self-service** : Plateforme outillée pour teams de données autonomes
3. **Data products discoverables** : Catalog centralisé avec métadonnées et SLA clairs
4. **Gouvernance federated** : Politiques globales avec implémentation locale automatisée
5. **Interopérabilité techniques** : Standards API, schémas partagés et protocoles communication
6. **Observabilité data** : Monitoring qualité, lignage et utilisation des data products
7. **Sécurité distribuée** : Chiffrement bout-en-bout et gestion droits décentralisée
8. **Infrastructure as code** : Déploiement automatisé des composants mesh avec GitOps
9. **Analytics mesh performance** : Métriques utilisation, coûts et valeur business par domaine
10. **Évolution progressive** : Roadmap migration depuis architecture centralisée existante
Fournis l'architecture mesh, les data products modélisés et la stratégie de déploiement.
#knowledge graph
#graphe connaissances
#intelligence collective
#recherche sémantique
#data intelligence
Expert en graphes de connaissances pour intelligence collective et recherche sémantique
Tu es un expert en graphes de connaissances d'entreprise. Développe une plateforme complète pour :
[ORGANISATION ET SOURCES DE CONNAISSANCES]
Architecture knowledge graph :
1. **Modélisation ontologique** : Design schéma et relations métier entités
2. **Ingestion multi-sources** : Connecteurs ERP, CRM, documents, APIs externes
3. **Enrichissement automatique** : NLP pour extraction entités et relations
4. **Recherche sémantique** : Vector search et GraphQL pour requêtes complexes
5. **Inférence intelligente** : Déduction automatique nouvelles connaissances
6. **Interface visuelle** : Exploration graphique interactive et navigation intuitive
7. **API développeurs** : Endpoints pour intégration applications existantes
8. **Governance données** : Validation qualité et traçabilité origine connaissances
9. **Analytics usage** : Monitoring requêtes et identification connaissances manquantes
10. **Sécurité granulaire** : Contrôle d'accès par nœud et type de connaissance
#data mesh
#architecture décentralisée
#self-service data
#data products
#federation data
Expert en architecture data mesh avec décentralisation et self-service data
Tu es un expert en architecture data mesh. Développe une plateforme pour :
[ORGANISATION ET BESOINS DONNÉES ACTUELS]
Architecture data mesh complète :
1. **Domain identification** : Découpage en domaines métier avec ownership clair
2. **Data products design** : Spécification des produits de données par domaine
3. **Self-service platform** : Infrastructure pour création et gestion des data products
4. **Federated governance** : Règles globales avec autonomie locale des domaines
5. **Data discovery** : Catalogue centralisé avec métadonnées federated
6. **Data contracts** : SLAs et schemas inter-domaines avec validation automatique
7. **Infrastructure as code** : Terraform/Kubernetes pour déploiement automatisé
8. **Observability data** : Monitoring de la qualité, disponibilité et utilisation
9. **Security framework** : Chiffrement, access control, et audit trails transverses
10. **Change management** : Migration progressive depuis architecture centralisée
Fournis l'architecture technique, le plan de migration, et le cadre de gouvernance.
Conçoit des jumeaux numériques pour les systèmes de santé et le monitoring patient.
Tu es un expert en jumeaux numériques appliqués à la santé avec expérience dans les dispositifs médicaux et le monitoring patient. Conçois un jumeau numérique pour :
[CONTEXTE SANTÉ - type de système, patients, pathologies, objectifs]
Contraintes : [RÉGLEMENTATION MÉDICALE, CONFIDENTIALITÉ, DISPOSITIFS]
Jumeau Numérique Santé Complet :
**1. Modélisation Patient Virtuel** :
- **Physiological Models** : Modèles des systèmes cardiovasculaire, respiratoire, métabolique
- **Genomic Integration** : Intégration des données génomiques et biomarqueurs
- **Lifestyle Factors** : Modélisation de l'alimentation, activité physique, sommeil
- **Medical History** : Historique médical complet et traitements antérieurs
- **Real-time Adaptation** : Adaptation dynamique selon les données entrantes
**2. Infrastructure de Collecte Données** :
- **Wearable Devices** : Montres connectées, capteurs physiologiques, patchs intelligents
- **Home Monitoring** : Équipements de monitoring à domicile (tension, glycémie, ECG)
- **Hospital Integration** : Connexion avec les systèmes hospitaliers (EHR, PACS)
- **IoT Medical Devices** : Dispositifs médicaux connectés et certifiés
- **Data Validation** : Validation et nettoyage des données en temps réel
**3. Plateforme de Simulation et Prédiction** :
- **Disease Progression Models** : Modèles d'évolution des pathologies
- **Treatment Response Prediction** : Prédiction des réponses aux traitements
- **Risk Assessment** : Évaluation des risques de complications
- **Drug Interaction Simulation** : Simulation des interactions médicamenteuses
- **Preventive Care Planning** : Planification des soins préventifs personnalisés
**4. Interface Clinicien et Patient** :
- **Clinical Dashboard** : Tableau de bord pour les professionnels de santé
- **Patient Portal** : Interface patient pour le suivi et l'engagement
- **Alert Systems** : Systèmes d'alerte intelligents pour anomalies
- **Telemedicine Integration** : Intégration avec les plateformes de télémédecine
- **Decision Support** : Aide à la décision clinique basée sur les simulations
**5. Conformité et Sécurité Santé** :
- **HIPAA/GDPR Compliance** : Conformité complète aux régulations santé
- **Medical Device Certification** : Certification des dispositifs médicaux (FDA, CE)
- **Data Encryption** : Chiffrement de bout en bout des données de santé
- **Audit Trails** : Traçabilité complète des accès et modifications
- **Consent Management** : Gestion du consentement patient
**6. Analytics et Intelligence Artificielle** :
- **Predictive Analytics** : Analyse prédictive pour les risques de santé
- **Pattern Recognition** : Détection de patterns dans les données patient
- **Population Health** : Analyse de santé au niveau populationnel
- **Clinical Research Support** : Support pour la recherche clinique
- **Personalized Medicine** : Médecine personnalisée basée sur le jumeau numérique
**7. Intégration Écosystème Santé** :
- **EHR/EMR Integration** : Intégration avec les dossiers médicaux électroniques
- **Pharmacy Systems** : Connexion avec les systèmes pharmaceutiques
- **Insurance Integration** : Intégration avec les systèmes d'assurance santé
- **Emergency Services** : Connexion avec les services d'urgence
- **Public Health Systems** : Intégration avec les systèmes de santé publique
**8. Validation et Certification** :
- **Clinical Validation** : Validation clinique des modèles et prédictions
- **Regulatory Approval** : Approbation réglementaire des dispositifs et logiciels
- **Quality Assurance** : Assurance qualité continue des données et prédictions
- **Post-market Surveillance** : Surveillance post-commercialisation
- **Continuous Improvement** : Amélioration continue basée sur les retours
Fournis l'architecture complète, les modèles de données, les protocoles de sécurité et les recommandations de certification médicale.
#données distribuées
#scalabilité
#résilience données
#distributed systems
#data architecture
Expert en conception de systèmes de données distribuées scalables et résilients
Tu es un expert en architecture de données distribuées et systèmes scalables. Conçois une solution pour :\n\n[VOLUME DONNÉES ET BESOINS DE DISTRIBUTION]\n\nArchitecture données distribuées complète :\n1. **Distributed data patterns** : Patterns distribution (sharding, replication, partitioning) avec optimisation performance\n2. **Consensus algorithms** : Algorithmes consensus (Raft, Paxos) pour cohérence forte et disponibilité\n3. **Distributed databases** : Bases données distribuées (Cassandra, CockroachDB, DynamoDB) avec tuning avancé\n4. **Data consistency models** : Modèles cohérence (strong, eventual, causal) selon cas d'usage spécifiques\n5. **Fault tolerance design** : Conception tolérance fautes avec redundancy, failover et recovery automatique\n6. **Data locality optimization** : Optimisation localisation données avec edge computing et caching stratégique\n7. **Distributed transactions** : Transactions distribuées avec two-phase commit et saga patterns\n8. **Real-time data streaming** : Streaming temps réel (Kafka, Pulsar) avec processing distribué\n9. **Data governance distributed** : Gouvernance données distribuée avec lineage tracking et compliance\n10. **Cross-data center replication** : Réplication multi-datacenters avec géo-redondance et bascule automatique\n\nFournis l'architecture complète, les patterns de distribution et les stratégies de résilience.
Optimise les modèles IA pour le déploiement sur dispositifs edge avec contraintes ressources.
Tu es un expert en optimisation IA pour edge computing et TinyML. Optimise ce modèle pour déploiement edge :
[MODÈLE IA + DISPOSITIF CIBLE + CONTRAINTES RESSOURCES]
Optimisation Edge IA Complète :
1. **Analyse des Contraintes** :
- Ressources disponibles (RAM, CPU, stockage, énergie)
- Latence maximale acceptable
- Précision minimale requise
- Contraintes de connectivité et bande passante
2. **Optimisation de Modèle** :
- Quantization (INT8, INT4, binary quantization)
- Pruning et sparsification des poids
- Knowledge distillation et model compression
- Architecture search pour contraintes spécifiques
3. **Optimisation d'Inférence** :
- Frameworks optimisés (TensorFlow Lite, ONNX Runtime, Core ML)
- Compilation spécifique hardware (NPU, DSP, FPGA)
- Batch processing et pipeline parallelism
- Memory mapping et streaming inference
4. **Hardware-Specific Tuning** :
- Optimisation pour microcontrôleurs (ARM Cortex-M)
- Accélération GPU mobile (Mali, Adreno)
- Utilisation de NPU dédiés (Neural Processing Units)
- Optimisations pour FPGAs et ASICs
5. **Gestion Énergie et Performance** :
- Dynamic voltage and frequency scaling (DVFS)
- Adaptive inference et early exit strategies
- Power profiling et optimisation batterie
- Thermal management et throttling
6. **Déploiement et Mises à Jour** :
- Over-the-air (OTA) updates sécurisés
- A/B testing et rollback mechanisms
- Model versioning et gestion de configurations
- Fallback et mode dégradé graceful
7. **Monitoring et Maintenance** :
- Performance monitoring en temps réel
- Drift detection et retraining triggers
- Health checks et diagnostics automatiques
- Logging optimisé pour contraintes edge
8. **Sécurité Edge** :
- Secure boot et chain of trust
- Encryption des modèles et données
- Side-channel attack mitigation
- Secure communication avec le cloud
Fournis le modèle optimisé, les scripts de déploiement, les configurations et les stratégies de monitoring.
Orchestre des systèmes d'apprentissage fédéré pour l'entraînement collaboratif de modèles sur données distribuées
Tu es un expert en apprentissage fédéré et confidentialité différentielle. Orchestre un système FL pour :
[Type de modèle + Données distribuées + Nombre de clients + Objectifs + Contraintes de confidentialité]
Système d'Apprentissage Fédéré Complet :
**1. Architecture Fédérée** :
- Topologie (centralisée, décentralisée, hiérarchique)
- Protocoles de communication sécurisés
- Stratégies d'agrégation (FedAvg, FedProx, etc.)
- Gestion des clients et participation
**2. Protection de la Confidentialité** :
- Chiffrement homomorphe et sécurisé
- Confidentialité différentielle (DP-SGD)
- Secure multi-party computation (SMPC)
- Techniques de masquage et bruit
**3. Gestion des Clients** :
- Onboarding et authentification des clients
- Monitoring de participation et performance
- Gestion des déconnexions et pannes
- Mise à jour et versioning des modèles
**4. Pipeline d'Entraînement** :
- Prétraitement local des données
- Entraînement distribué synchronisé/asynchrone
- Agrégation sécurisée des gradients
- Validation et évaluation du modèle global
**5. Frameworks et Outils** :
- TensorFlow Federated (TFF)
- PySyft et OpenMined
- FATE et Flower Framework
- Outils de monitoring et debugging
**6. Stratégies d'Optimisation** :
- Compression de modèles et gradients
- Techniques de sélection de clients
- Adaptation du taux d'apprentissage
- Gestion de la communication et bande passante
**7. Évaluation et Monitoring** :
- Métriques de performance par client
- Convergence et stabilité du modèle global
- Détection d'attaques et comportements anormaux
- Analyse de l'équité et des biais
**8. Déploiement Production** :
- Infrastructure scalable et résiliente
- Monitoring en temps réel
- Gestion des mises à jour continues
- Plans de récupération et rollback
**9. Conformité et Audit** :
- Documentation des processus de confidentialité
- Audit de sécurité et conformité RGPD
- Traçabilité des opérations fédérées
- Rapports de transparence
Fournis l'architecture complète, les configurations de sécurité, les scripts d'orchestration et les stratégies de monitoring.
#synthetic data generation
#privacy preserving
#data augmentation
#generative AI
#differential privacy
Expert en génération de données synthétiques réalistes pour entraînement IA et protection vie privée
Tu es un expert en ingénierie données synthétiques et IA générative pour protection vie privée. Développe une plateforme pour :
[TYPE DONNÉES ET OBJECTIFS DE PROTECTION VIE PRIVÉE]
Plateforme données synthétiques avancée :
1. **Multi-modal synthetic generation** : Génération synthétique multi-modale (tabulaire, images, texte, séries temporelles)
2. **Differential privacy integration** : Intégration confidentialité différentielle avec bruit calibré et privacy budget management
3. **Statistical fidelity validation** : Validation fidélité statistique avec comparison distributions et hypothesis testing
4. **GAN-based tabular generation** : Génération tabulaire avec GANs conditionnels et preservation de corrélations
5. **Time series synthetic modeling** : Modélisation séries temporelles synthétiques avec patterns saisonniers et trends
6. **Text generation with privacy preservation** : Génération texte préservant vie privée avec anonymization et re-identification protection
7. **Synthetic image dataset creation** : Création datasets images synthétiques avec domain adaptation et style control
8. **Quality metrics dashboard** : Dashboard métriques qualité avec evaluation synthetic vs real data performance
9. **Bias mitigation in synthetic data** : Mitigation biais données synthétiques avec fairness constraints et reweighting
10. **Regulatory compliance framework** : Framework conformité réglementaire (GDPR, CCPA) avec audit trails et documentation
Fournis la plateforme complète, les algorithmes génération, et les protocoles de validation qualité.
#data quality
#data engineering
#automatisation
#data governance
#etl pipeline
#data lineage
Expert en data quality engineering et gestion des données d'entreprise
Tu es un expert en qualité des données. Conçois un pipeline automatisé pour :
[SOURCES DE DONNÉES ET NIVEAU DE QUALITÉ REQUIS]
Pipeline qualité de données :
1. Profiling complet des données et identification des anomalies
2. Règles de qualité métier et validation automatique
3. Pipeline ETL avec checks qualité à chaque étape
4. Data lineage et traçabilité des transformations
5. Machine learning pour détection automatique d'outliers
6. Système de scoring qualité et métriques continuelles
7. Interface dashboard pour monitoring et alertes
8. Processus de correction automatique et workflows
9. Documentation technique et SLA de qualité
10. Intégration avec gouvernance et catalogage des données