Контрольная работа по дисциплине: Обработка и визуализация информации. Вариант №8.

Контрольная работа
по дисциплине «Обработка и визуализация информации»

Тема: Обработка и визуализация данных на Python с использованием датасета Boston Housing

Цель работы:
1. Изучение обработки и визуализации данных в Python.
2. Закрепление навыков:
• Загрузки и предобработки данных в Pandas.
• Построения статистических графиков (Matplotlib, Seaborn).
• Анализа корреляций и группировки данных.

Задание:
• Провести анализ датасета Boston Housing, включая визуализацию распределений, корреляций и группировку по заданным критериям.
• Сформировать отчет, куда занести результаты по каждому заданию.

Для этого надо выполнить 6 отдельных заданий:
Задание 1: ознакомиться с данным датасетом, выгрузить файл «Контрольная.pynb» в Google Colab. Ссылка на датасет:
https://raw.githubusercontent.com/selva86/datasets/master/BostonHousing.csv. Открыв по ссылке датасет, вы сможете ознакомиться с набором данных (наименования полей, типы значений, есть ли пустые значения).

Задание 2: написать программный код, в котором выведите 10 первых строк из датасета и замените названия переменных заглавными буквами
Программный код должен содержать:
• Функцию изменения регистра
• Вывод заданного количества строк

Задание 3: написать программный код для построения матрицы корреляции (.corr()) в виде тепловой карты (sns.heatmap).

Задание 4: проанализировать два заданных значения и их зависимость (таблица 1):
• Определить, что в датасете означает каждое значение.
• Провести анализ заданной корреляции этих значений и интерпретировать его, т.е. словесно вывести, что на основании данного значения корреляции следует, что …
Внимание: Программный код не пишите, а учитесь анализировать наборы данных, их зависимость и делать выводы.

Последняя
цифра пароля Значения и корреляция между ними
8 CHAS и CRIM = -0.18

Задание 5: построить график распределения целевой переменной (MEDV). Указать в каком диапазоне лежит наиболее вероятное значение переменной.

Задание 6: написать программный код, в котором необходимо:
• Сгруппировать дома по критерию приближенности к реке Чарльз.
• Определить по полученному результату, в какой группе выше показатель, заданный в таблице 3. Например, у домов вдоль реки Чарльз уровень преступности ниже, чем у домов, построенных вдали от реки, из этого следует вывод, что...
В отчет вставить скрин с программным кодом, результат в виде рассчитанного значения показателя и ваш вывод, что означает это вычисленное значение.
Последняя
цифра пароля Показатель
8 INDUS
Таблица 2 (брать вариант по последней цифре пароля)

500,00 ₽
Скриншот работы
Скриншот работы

Автор: Николай

Предмет: Обработка и анализ данных

Университет: СибГУТИ

Дата добавления: 24.03.2026

Куплено раз: 0

Файл Контр_работа_D3Csp07.docx 344,8 КБ