code-review-101-penguinqq
Heart Disease Data Analysis
Студент: Гололобов Александр Андреевич Группа: РИ-150942/1 Номер задания: 9
Описание задания
В этом задании выполнен анализ датасета Heart Disease для выявления факторов, связанных с сердечно-сосудистыми заболеваниями.
Что нужно анализировать
Датасет Heart Disease содержит медицинские данные пациентов и информацию о наличии сердечных заболеваний. Необходимо провести анализ:
- Загрузки данных
- Общей информации о датасете
- Анализа целевой переменной
- Визуализации распределений
- Анализа признаков
- Изучения корреляций
Выполненные работы
0. Информация о рецензируемых работах
- alisa_boules
1. Загрузка данных
Данные загружаются из датасета msahdatascience/heart-disease-dataset с помощью библиотеки datasets и конвертируются в pandas DataFrame.
2. Анализ данных
Проведён подробный анализ данных включающий:
- Размер датасета и типы данных
- Проверку на пропущенные значения
- Распределение целевой переменной
- Статистику числовых признаков
3. Визуализация
Созданы следующие визуализации:
09_heart_disease_target_distribution.png - распределение целевой переменной (столбчатая диаграмма и круговая диаграмма)
09_heart_disease_features_distribution.png - распределения числовых медицинских показателей (age, trestbps, chol, thalach, oldpeak)
09_heart_disease_features_by_target.png - boxplot-диаграммы признаков в зависимости от наличия заболевания
09_heart_disease_correlation_bars.png - тепловая карта корреляций между признаками
09_heart_disease_demographics.png - анализ возраста и пола:
- Распределение возраста
- Распределение болезней по возрастным группам
- Распределение возраста по полу и наличию заболевания
4. Статистика
Для каждого числового признака вычислены:
- Среднее значение
- Медиана
- Стандартное отклонение
- Минимум и максимум
5. Ключевые находки
- Проанализирована корреляция признаков с целевой переменной
- Выявлены топ-10 корреляций между признаками
- Изучено распределение болезней по возрастным группам
- Проанализирована зависимость от пола пациента
Файлы
- основной файл с кодом анализаassignment.py- этот файл с документациейREADME.md- список зависимостей Pythonrequirements.txt- график распределения целевой переменной09_heart_disease_target_distribution.png- графики распределений признаков09_heart_disease_features_distribution.png- boxplot-графики признаков по классам09_heart_disease_features_by_target.png- тепловая карта корреляций09_heart_disease_correlation_bars.png- графики демографического анализа09_heart_disease_demographics.png
Удалены следующие файлы:
- ASSIGNMENTS_README.md
- CODE_REQUIREMENTS.md
- MATPLOTLIB_CHEATSHEET.md
- PANDAS_CHEATSHEET.md
- CONTRIBUTING.md
- FILE_UPDATE_REPORT.md