🏠 Home
Prestatietests
📊 Alle benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List applicaties 🎨 Creatieve vrije pagina's 🎯 FSACB - Ultieme showcase 🌍 Vertaalbenchmark
Modellen
🏆 Top 10 modellen 🆓 Gratis modellen 📋 Alle modellen ⚙️ Kilo Code
Bronnen
💬 Promptbibliotheek 📖 AI-woordenlijst 🔗 Nuttige links
Продвинутый

Анализ данных и визуализация на Python

#python #pandas #анализ данных #машинное обучение

Написание сложного скрипта на Python для обработки, очистки и визуализации данных с пропущенными значениями.

Действуй как Senior Data Scientist. Напиши скрипт на Python, используя библиотеки Pandas и NumPy. Скрипт должен выполнять следующие действия с набором данных CSV: 1. Загрузку данных и выявление типов столбцов. 2. Обработку пропущенных значений (заполнение средним/медианой или удаление в зависимости от контекста). 3. Удаление выбросов с использованием метода межквартильного размаха (IQR). 4. Создание новых производных признаков (feature engineering). 5. Генерацию статистической сводки. 6. Визуализацию корреляционной матрицы и распределения ключевых переменных, используя код для Matplotlib/Seaborn (вывод кодом, без графика). Код должен быть готов к запуску и содержать обработку ошибок.