🏠 Home
Benchmark Hub
📊 All Benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List Applications 🎨 Creative Free Pages 🎯 FSACB - Ultimate Showcase 🌍 Translation Benchmark
Models
🏆 Top 10 Models 🆓 Free Models 📋 All Models ⚙️ Kilo Code
Resources
💬 Prompts Library 📖 AI Glossary 🔗 Useful Links
Продвинутый

Анализ данных и визуализация на Python

#python #pandas #анализ данных #машинное обучение

Написание сложного скрипта на Python для обработки, очистки и визуализации данных с пропущенными значениями.

Действуй как Senior Data Scientist. Напиши скрипт на Python, используя библиотеки Pandas и NumPy. Скрипт должен выполнять следующие действия с набором данных CSV: 1. Загрузку данных и выявление типов столбцов. 2. Обработку пропущенных значений (заполнение средним/медианой или удаление в зависимости от контекста). 3. Удаление выбросов с использованием метода межквартильного размаха (IQR). 4. Создание новых производных признаков (feature engineering). 5. Генерацию статистической сводки. 6. Визуализацию корреляционной матрицы и распределения ключевых переменных, используя код для Matplotlib/Seaborn (вывод кодом, без графика). Код должен быть готов к запуску и содержать обработку ошибок.