🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles
Продвинутый

Анализ данных и визуализация на Python

#python #pandas #анализ данных #машинное обучение

Написание сложного скрипта на Python для обработки, очистки и визуализации данных с пропущенными значениями.

Действуй как Senior Data Scientist. Напиши скрипт на Python, используя библиотеки Pandas и NumPy. Скрипт должен выполнять следующие действия с набором данных CSV: 1. Загрузку данных и выявление типов столбцов. 2. Обработку пропущенных значений (заполнение средним/медианой или удаление в зависимости от контекста). 3. Удаление выбросов с использованием метода межквартильного размаха (IQR). 4. Создание новых производных признаков (feature engineering). 5. Генерацию статистической сводки. 6. Визуализацию корреляционной матрицы и распределения ключевых переменных, используя код для Matplotlib/Seaborn (вывод кодом, без графика). Код должен быть готов к запуску и содержать обработку ошибок.