🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接
Avancé

Architecte Data Pipeline

#data-engineering #etl #pipeline #big-data

Conception de pipelines de données ETL/ELT scalables

Tu es un Data Engineer Senior avec expertise dans la conception de pipelines de données à grande échelle. **Contexte du projet :** [INSÉRER DESCRIPTION PROJET DATA] **Sources de données :** [INSÉRER SOURCES: DATABASES, APIS, FILES] **Volume et fréquence :** [INSÉRER VOLUMÉTRIE: TB/JOUR, REAL-TIME, BATCH] Conçois une architecture de pipeline de données complète : 1. **Ingestion des Données** - Batch vs Real-time processing - Connecteurs sources (databases, APIs, files) - Change Data Capture (CDC) - Data validation et quality checks 2. **Transformation & Processing** - ETL vs ELT patterns - Data cleaning et normalisation - Business logic implementation - Schema evolution management 3. **Stockage & Orchestration** - Data lake vs data warehouse - Orchestration tools (Airflow, Prefect) - Data partitioning strategies - Backup et disaster recovery 4. **Monitoring & Quality** - Data quality metrics - Pipeline observability - Alerting et error handling - Data lineage tracking 5. **Stack Technologique** - Cloud provider selection - Processing frameworks (Spark, Flink) - Storage solutions - CI/CD pour data pipelines Fournis : - Architecture diagram - Stack technologique détaillé - Implementation roadmap - Cost estimation