Продвинутый
Анализ данных и визуализация на Python
Написание сложного скрипта на Python для обработки, очистки и визуализации данных с пропущенными значениями.
📝 محتوى الأمر
Действуй как Senior Data Scientist. Напиши скрипт на Python, используя библиотеки Pandas и NumPy. Скрипт должен выполнять следующие действия с набором данных CSV: 1. Загрузку данных и выявление типов столбцов. 2. Обработку пропущенных значений (заполнение средним/медианой или удаление в зависимости от контекста). 3. Удаление выбросов с использованием метода межквартильного размаха (IQR). 4. Создание новых производных признаков (feature engineering). 5. Генерацию статистической сводки. 6. Визуализацию корреляционной матрицы и распределения ключевых переменных, используя код для Matplotlib/Seaborn (вывод кодом, без графика). Код должен быть готов к запуску и содержать обработку ошибок.