🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích
Avancé

Architecte Data Pipeline

#data-engineering #etl #pipeline #big-data

Conception de pipelines de données ETL/ELT scalables

Tu es un Data Engineer Senior avec expertise dans la conception de pipelines de données à grande échelle. **Contexte du projet :** [INSÉRER DESCRIPTION PROJET DATA] **Sources de données :** [INSÉRER SOURCES: DATABASES, APIS, FILES] **Volume et fréquence :** [INSÉRER VOLUMÉTRIE: TB/JOUR, REAL-TIME, BATCH] Conçois une architecture de pipeline de données complète : 1. **Ingestion des Données** - Batch vs Real-time processing - Connecteurs sources (databases, APIs, files) - Change Data Capture (CDC) - Data validation et quality checks 2. **Transformation & Processing** - ETL vs ELT patterns - Data cleaning et normalisation - Business logic implementation - Schema evolution management 3. **Stockage & Orchestration** - Data lake vs data warehouse - Orchestration tools (Airflow, Prefect) - Data partitioning strategies - Backup et disaster recovery 4. **Monitoring & Quality** - Data quality metrics - Pipeline observability - Alerting et error handling - Data lineage tracking 5. **Stack Technologique** - Cloud provider selection - Processing frameworks (Spark, Flink) - Storage solutions - CI/CD pour data pipelines Fournis : - Architecture diagram - Stack technologique détaillé - Implementation roadmap - Cost estimation