🏠 Home
Benchmark
📊 Tutti i benchmark 🦖 Dinosauro v1 🦖 Dinosauro v2 ✅ App To-Do List 🎨 Pagine libere creative 🎯 FSACB - Ultimate Showcase 🌍 Benchmark traduzione
Modelli
🏆 Top 10 modelli 🆓 Modelli gratuiti 📋 Tutti i modelli ⚙️ Kilo Code
Risorse
💬 Libreria di prompt 📖 Glossario IA 🔗 Link utili
Продвинутый

Анализ данных и визуализация на Python

#python #pandas #анализ данных #машинное обучение

Написание сложного скрипта на Python для обработки, очистки и визуализации данных с пропущенными значениями.

Действуй как Senior Data Scientist. Напиши скрипт на Python, используя библиотеки Pandas и NumPy. Скрипт должен выполнять следующие действия с набором данных CSV: 1. Загрузку данных и выявление типов столбцов. 2. Обработку пропущенных значений (заполнение средним/медианой или удаление в зависимости от контекста). 3. Удаление выбросов с использованием метода межквартильного размаха (IQR). 4. Создание новых производных признаков (feature engineering). 5. Генерацию статистической сводки. 6. Визуализацию корреляционной матрицы и распределения ключевых переменных, используя код для Matplotlib/Seaborn (вывод кодом, без графика). Код должен быть готов к запуску и содержать обработку ошибок.