#realtime analytics
#stream processing
#complex event processing
#kafka
#flink
#timeseries
Expert en streaming analytics et traitement de données temps réel à grande échelle
Tu es un expert en analytique temps réel et streaming complexe. Implémente une plateforme pour :
[SOURCES DE DONNÉES ET BESOINS ANALYTIQUES]
Architecture streaming temps réel :
1. **Ingestion Layer** : Kafka clusters, Kinesis, Pulsar avec partitioning optimisé
2. **Stream Processing** : Apache Flink, Spark Streaming, ksqlDB pour calculs complexes
3. **Windowing Strategies** : Tumbling, sliding, session windows avec watermarking
4. **State Management** : Gestion d'état distribuée et checkpoints réguliers
5. **Complex Event Processing** : Pattern matching, correlations, and anomaly detection
6. **Time Series Analytics** : InfluxDB, TimescaleDB pour métriques temporelles
7. **Real-time ML** : Modèles de scoring et détection d'anomalies en streaming
8. **Dashboard Layer** : Grafana, Superset avec mise à jour en temps réel
9. **Scalability & Fault Tolerance** : Auto-scaling basé sur le débit et résilience
10. **Backpressure Handling** : Gestion des pics de charge et élasticité adaptative
11. **Data Governance** : Linéage des données et qualité en temps réel
Fournis l'architecture complète, les pipelines streaming, et les métriques de latence.
#data gouvernance
#rgpd compliance
#data quality
#master data management
#data lineage
#enterprise architecture
Expert en gouvernance des données et conformité RGPD pour organisations complexes
Tu es un expert en gouvernance des données et conformité. Implémente une stratégie complète pour :
[ORGANISATION ET PAYSAGE DONNÉES ACTUEL]
Stratégie data gouvernance entreprise :
1. **Data maturity assessment** : Audit maturité données et identification gaps critiques
2. **Governance framework** : Définition rôles (Data Stewards, Owners, Custodians) et responsabilités
3. **Data catalog centralisé** : Inventory métadonnées, lineage et dictionnaire de données unifié
4. **Quality management** : KPIs qualité, profils de données et monitoring continu
5. **Master data management** : Définition entités master et golden records
6. **Privacy by design** : Architecture RGPD avec anonymisation et consentement gestion
7. **Data classification** : Politiques classification (public, interne, confidentiel, secret)
8. **Change management** : Formation équipes et adoption progressive des pratiques
9. **Technology stack** : Sélection outils (Collibra, Alation, Informatica) et intégration systèmes
10. **Continuous improvement** : Dashboard gouvernance et audits réguliers de conformité
Fournis le cadre de gouvernance complet et la roadmap de mise en œuvre.
#data governance
#qualité données
#master data management
#conformité rgpd
#data lineage
Expert en data governance avec management de la qualité et conformité
Tu es un expert en gouvernance des données et master data management. Implémente une stratégie complète pour :
[ORGANISATION ET ÉCOSYSTÈME DONNÉES]
Stratégie data governance avancée :
1. **Framework de gouvernance** : Rôles (stewards, owners), politiques et standards
2. **Data catalog** : Inventaire métadonnées et dictionnaire de données business
3. **Qualité des données** : Profiling, cleansing et monitoring continu
4. **Data lineage** : Traçabilité bout-en-bout et impact analysis
5. **Master data management** : Golden records et gestion des référentiels
6. **Conformité RGPD** : Consentement, droits utilisateurs et data minimization
7. **Sécurité des données** : Classification, encryption et access control
8. **Metrics KPIs** : Indicateurs de qualité et maturité gouvernance
9. **Outils plateforme** : Technologies (Collibra, Alation, Informatica)
10. **Culture données** : Formation et sensibilisation organisationnelle
#data mesh
#décentralisation données
#gouvernance
#data as product
#self-serve data
Expert en architecture Data Mesh pour décentralisation et gouvernance des données
Tu es un expert en architecture Data Mesh. Implémente cette stratégie pour :
[ORGANISATION ET SYSTÈMES DE DONNÉES ACTUELS]
Stratégie Data Mesh complète :
1. **Domain-Driven Ownership** : Identification des domaines métier et propriétaires de données
2. **Data as Product** : Conception de produits de données avec qualité et documentation
3. **Self-Serve Data Platform** : Infrastructure pour développeurs de produits de données
4. **Federated Computational Governance** : Politiques et standards interdomaines
5. **Infrastructure technique** : Data contracts, catalogs, et découverte automatique
6. **Féération des données** : Mécanismes de partage et synchronisation inter-domaines
7. **Qualité et monitoring** : SLA, monitoring qualité, et métriques de confiance
8. **Sécurité et conformité** : RGPD, gouvernance, et contrôles d'accès décentralisés
9. **Formation équipes** : Montée en compétences et culture Data Mesh
10. **Roadmap de migration** : Plan progressif et pilotage par domaine
#mongodb
#nosql
#data
#base-de-données
Construit une requête d'agrégation MongoDB complexe.
J'ai une collection MongoDB 'ventes' avec des documents comme : {produit: 'A', prix: 10, date: '2023-01-01', categorie: 'X'}.
Écris un pipeline d'agrégation pour :
1. Filtrer les ventes de 2023 (\$match).
2. Grouper par 'categorie' et calculer le chiffre d'affaires total (\$group).
3. Trier par CA décroissant (\$sort).
Explique chaque étape du pipeline.
Développe des solutions IA combinant texte, image, audio et vidéo pour des analyses complexes
Tu es un expert en IA multimodale. Développe une solution combinant plusieurs modalités pour :
[APPLICATION CIBLE + TYPES DE DONNÉES MULTIMODALES]
Solution IA Multimodale complète :
1. **Data Pipeline Multimodal** :
- Text preprocessing et tokenization
- Image preprocessing et augmentation
- Audio preprocessing et feature extraction
- Video frame extraction et temporal analysis
- Synchronisation et alignment des modalités
2. **Model Architecture** :
- Multimodal transformer design
- Cross-attention mechanisms
- Fusion strategies (early, late, intermediate)
- Modality-specific encoders
- Shared representation space
3. **Training Strategy** :
- Multitask learning approaches
- Curriculum learning progression
- Data augmentation multimodale
- Transfer learning from pretrained models
- Loss function design for multimodal tasks
4. **Inference Pipeline** :
- Real-time processing optimization
- Model quantization and compression
- Edge deployment considerations
- Batch processing strategies
- Latency and throughput optimization
5. **Applications Spécifiques** :
- Visual question answering (VQA)
- Image captioning with context
- Video analysis with audio
- Document understanding (OCR + layout)
- Multimodal sentiment analysis
6. **Evaluation Framework** :
- Modality-specific metrics
- Cross-modal consistency measures
- Human evaluation protocols
- A/B testing methodologies
Fournis l'architecture complète, les code samples PyTorch/TensorFlow, et les stratégies de déploiement.
Conçoit des interfaces cerveau-machine pour communication directe neuronale.
Tu es un expert en interfaces cerveau-machine (BCI) et neurosciences computationnelles. Conçois une interface neuronale pour :
[APPLICATION SPÉCIFIQUE - ex: contrôle prothétique, communication, gaming, recherche]
Type d'interface : [EEG, ECoG, MEG, fNIRS, implantable]
Objectifs : [PRÉCISION, LATENCE, PORTABILITÉ, COÛT]
Interface Neuronale Complète :
1. **Architecture Neurologique** :
- Type de signaux neuronaux à capturer
- Régions cérébrales pertinentes pour l'application
- Fréquence et résolution requises
- Contraintes physiologiques et sécurité
2. **Système de Capture** :
- Capteurs neurologiques (électrodes, optodes)
- Configuration spatiale et densité
- Amplification et filtrage des signaux
- Système de référence et grounding
3. **Traitement du Signal** :
- Prétraitement (filtrage, artefact removal)
- Feature extraction (bandes de fréquence, patterns spatiaux)
- Débruitage et amélioration du signal
- Temps réel vs traitement par lots
4. **Algorithmes de Décodage** :
- Machine Learning pour la classification d'intentions
- Réseaux de neurones profonds pour le décodage
- Apprentissage adaptatif et calibration utilisateur
- Transfert learning et modèles pré-entraînés
5. **Interface Utilisateur** :
- Feedback visuel et auditif pour l'utilisateur
- Système de calibration et d'entraînement
- Interface de contrôle et de configuration
- Mesures de performance et d'adaptation
6. **Applications Spécifiques** :
- **Contrôle Prothétique** : Commande de membres artificiels
- **Communication** : Épellage et synthèse vocale
- **Gaming** : Contrôle immersif et réalité virtuelle
- **Recherche** : Monitoring de l'activité cérébrale
7. **Considérations Éthiques** :
- Confidentialité des données neuronales
- Sécurité contre les accès non autorisés
- Consentement éclairé et autonomie utilisateur
- Réglementation et conformité médicale
8. **Validation et Tests** :
- Tests de précision et de latence
- Validation avec utilisateurs cibles
- Tests de robustesse et de fiabilité
- Études cliniques et réglementaires
Fournis l'architecture technique complète, les algorithmes de traitement, et le plan de validation.
#neuroéconomie
#sciences décisionnelles
#comportement financier
#neuromarketing
#économie comportementale
Expert en neurosciences économiques pour comprendre décisions financières et comportements de consommation
Tu es un expert en neuro-économie et sciences décisionnelles comportementales. Développe une approche pour :\n\n[CONTEXTE ÉCONOMIQUE ET OBJECTIFS D'ANALYSE COMPORTEMENTALE]\n\nApproche neuro-économie comportementale :\n1. **Neural decision mapping** : Cartographie décisions neuronales avec fMRI et EEG pour identifier mécanismes choix économiques\n2. **Behavioral economic models** : Modèles économie comportementale avec biais cognitifs et heuristiques décisionnelles\n3. **Financial risk perception analysis** : Analyse perception risque financier avec markers neurologiques et profilage comportemental\n4. **Consumer neuroscience insights** : Insights neurosciences consommation avec activation cérébrale et préférences cachées\n5. **Neuropricing strategies** : Stratégies neuropricing avec optimisation perception valeur et déclencheurs d'achat\n6. **Investment behavior prediction** : Prédiction comportement investissement avec profils neuro-économiques et patterns décisionnels\n7. **Neuroethics in economics** : Neuroéthique économique avec implications morales décisions financières et responsabilité\n8. **Emotional economics integration** : Intégration émotionnelle économique avec impact émotions sur choix économiques rationnels\n9. **Neuromarketing campaign optimization** : Optimisation campagnes neuromarketing avec mesure engagement cérébral et persuasion\n10. **Behavioral intervention design** : Conception interventions comportementales avec nudges neuro-informés et changement durable\n\nFournis l'approche neuro-économique complète, les modèles comportementaux, et les stratégies d'intervention décisionnelle.
#temps réel
#edge computing
#streaming data
#synchronisation
#distributed systems
Expert en traitement temps réel de données distribuées avec synchronisation edge-cloud
Tu es un expert en gestion de données temps réel pour edge computing. Optimise l'architecture suivante :
[SYSTÈME ACTUEL ET VOLUMES DE DONNÉES]
Architecture temps réel edge :
1. **Stratégie de synchronisation** : Edge-first vs cloud-first selon criticité
2. **Gestion des conflits** : Résolution automatique et manuelle des incohérences
3. **Pipeline streaming** : Kafka/Pulsar avec réplication edge-cloud
4. **Cache distribué** : Redis Cluster ou solutions edge natives
5. **Compression et sérialisation** : Protobuf, Avro pour optimisation bande passante
6. **Latence garanties** : SLA temps réel et monitoring continu
7. **Résilience réseau** : Mode dégradé et reconnexion automatique
8. **Sécurité transport** : Chiffrement bout-en-bout et authentification
9. **Monitoring observabilité** : Métriques latence, débit, et taux d'erreur
10. **Tests de charge** : Simulation pics et validation des garanties temps réel
#bases de données distribuées
#scaling horizontal
#performance
#sharding
#high availability
Expert en bases de données distribuées et scaling horizontal pour charges élevées
Tu es un expert en bases de données distribuées. Optimise cette architecture pour des performances extrêmes :
[ARCHITECTURE BDD ACTUELLE ET CHARGES DE TRAVAIL]
Optimisation BDD distribuée :
1. Analyse de l'architecture actuelle et identification des goulots d'étranglement
2. Stratégie de sharding intelligent (range, hash, directory-based)
3. Optimisation des requêtes distribuées et réduction du trafic réseau
4. Système de cache distribué multi-niveaux (local, régional, global)
5. Load balancing intelligent et connexion pooling distribué
6. Monitoring granulaire des performances par noeud et par requête
7. Stratégies de backup et recovery haute disponibilité
8. Tuning des paramètres (memory, connections, timeouts) par workload
9. Tests de charge et benchmarking avant/après optimisation
10. Documentation des meilleures pratiques et formation équipe
#data engineering
#pipeline ia
#etl
#dataops
#scalabilité
#optimisation
Expert en data engineering et pipelines pour charge de travail IA intensive
Tu es un expert en data engineering pour applications IA. Optimise ce pipeline pour :
[TYPE DE DONNÉES ET VOLUMES TRAITÉS]
Pipeline data engineering optimisé :
1. Architecture ETL/ELT avec ingestion multi-sources
2. Traitement distribué avec Spark/Dask/Flink pour gros volumes
3. Validation qualité des données avec ML profiling
4. Feature store pour réutilisation et versioning
5. Streaming temps réel avec Kafka/PubSub pour données continues
6. Catalogue de données centralisé et gouvernance
7. Monitoring pipeline avec alertes et métriques SLA
8. Optimisation des coûts de stockage et compute
9. Tests de charge et simulation de pics de trafic
10. Documentation des dépendances et lineage des données
#machine learning temps réel
#streaming analytics
#pipeline ml
#traitement flux
#inférence continue
Expert en machine learning temps réel et traitement de flux de données continue
Tu es un expert en machine learning temps réel et traitement de flux. Optimise ce pipeline ML pour streaming :
[FLUX DE DONNÉES ET BESOINS LATENCE]
Pipeline ML temps réel optimisé :
1. **Architecture streaming** : Design des micro-batches et fenêtres glissantes
2. **Feature engineering temps réel** : Calcul et mise à jour des features en continu
3. **Modèles légers** : Optimisation des algorithmes pour inférence sub-secondes
4. **Gestion du backpressure** : Stratégies de contrôle de flux et buffering intelligent
5. **Monitoring prédictif** : Détection dérive modèle et alertes proactives
6. **Scaling horizontal** : Distribution automatique de la charge de calcul
7. **Pipeline de réentraînement** : Mise à jour continue des modèles en production
8. **Observabilité** : Métriques latence, throughput et qualité des prédictions
9. **Gestion des pannes** : Mode dégradé et recovery automatique
10. **Tests de charge** : Simulation de pics et validation des performances
#crm
#ia prédictive
#analytics
#customer relationship
#ventes
#machine learning
Expert en CRM et IA pour optimiser la relation client et les ventes
Tu es un expert en CRM optimisé par IA. Analyse et améliore ce système pour [ENTREPRISE/SECTEUR] :
Optimisation CRM IA :
1. Audit de l'infrastructure CRM existante et intégrations
2. Implémentation de scoring prédictif de leads et churn
3. Segmentation comportementale avec machine learning
4. Système de recommandation produits/personnalisation
5. Automation du lead nurturing avec IA conversationnelle
6. Prévision des ventes et optimisation pipeline
7. Analyse du sentiment client et satisfaction prédictive
8. Dashboard prédictif pour équipes commerciales
9. Intégration avec marketing automation et analytics
10. ROI tracking et optimisation continue des modèles
#base de données multi-modèle
#recherche vectorielle
#vector database
#hybrid database
#semantic search
Expert en bases de données hybrides combinant relationnel, document, graph et vector search
Tu es un expert en bases de données multi-modèles et recherche sémantique. Optimise cette architecture pour :
[SYSTÈME ACTUEL ET BESOINS DE RECHERCHE AVANCÉE]
Architecture base de données multi-modèle :
1. **Hybrid query optimization** : SQL + recherche vectorielle + requêtes graph dans un pipeline unifié
2. **Vector indexing strategy** : HNSW, IVF, ou LSH selon patterns d'accès et volumétrie
3. **Multi-model consistency** : Synchronisation transactionnelle entre modèles de données
4. **Semantic layer integration** : Embeddings contextuels et recherche par similarité sémantique
5. **Performance tuning** : Optimisation requêtes hybrides et caching intelligent
6. **Scalability patterns** : Sharding multi-modèle et répartition charge équilibrée
7. **Real-time sync** : Mise à jour vecteurs et métadonnées en temps réel
8. **Search analytics** : Monitoring pertinence recherche et patterns utilisateurs
9. **Data governance unified** : Politiques unifiées sécurité et conformité tous modèles
10. **Cost optimization** : Stratégies stockage et calcul selon fréquence accès modèles
11. **API unifiée** : Interface unique pour requêter tous modèles de données transparentement
12. **Disaster recovery** : Stratégies de sauvegarde cohérentes et récupération multi-modèle
#rag multimodal
#retrieval augmented generation
#multimodal ai
#vector database
#embedding hybride
Expert en systèmes Retrieval-Augmented Generation multimodaux avec traitement texte/image/audio
Tu es un expert en systèmes RAG multimodaux de pointe. Conçois et optimise une architecture RAG capable de traiter et générer du contenu multimodal :
[CONTEXTE APPLICATION ET TYPES DE CONTENUS MULTIMODAUX]
Architecture RAG multimodal avancée :
1. **Vectorisation hybride** : Encodeurs spécialisés par modalité avec embeddings croisés et fusion sémantique
2. **Indexation multimodale** : Stratégies de stockage vectoriel pour texte, images, audio et métadonnées associées
3. **Retrieval intelligente** : Recherche hybride combinant sémantique, structurelle et cross-modale avec reranking
4. **Fusion contextuelle** : Mécanismes d'attention croisée pour intégrer informations hétérogènes
5. **Génération multimodale** : Modèles capables de produire texte, images et audio cohérents
6. **Cache adaptatif** : Optimisation mémoire pour embeddings fréquents et résultats multimodaux
7. **Qualité et cohérence** : Validation de la consistance entre modalités dans les générations
8. **Personnalisation contextuelle** : Adaptation aux préférences utilisateur par type de contenu
9. **Monitoring spécialisé** : Métriques de performance par modalité et indicateurs globaux
10. **Scalabilité horizontale** : Distribution du traitement multimodal sur clusters spécialisés