code-review-101-penguinqq

0
README.md

Heart Disease Data Analysis

Студент: Гололобов Александр Андреевич Группа: РИ-150942/1 Номер задания: 9

Описание задания

В этом задании выполнен анализ датасета Heart Disease для выявления факторов, связанных с сердечно-сосудистыми заболеваниями.

Что нужно анализировать

Датасет Heart Disease содержит медицинские данные пациентов и информацию о наличии сердечных заболеваний. Необходимо провести анализ:

  • Загрузки данных
  • Общей информации о датасете
  • Анализа целевой переменной
  • Визуализации распределений
  • Анализа признаков
  • Изучения корреляций

Выполненные работы

0. Информация о рецензируемых работах

  • alisa_boules

1. Загрузка данных

Данные загружаются из датасета msahdatascience/heart-disease-dataset с помощью библиотеки datasets и конвертируются в pandas DataFrame.

2. Анализ данных

Проведён подробный анализ данных включающий:

  • Размер датасета и типы данных
  • Проверку на пропущенные значения
  • Распределение целевой переменной
  • Статистику числовых признаков

3. Визуализация

Созданы следующие визуализации:

09_heart_disease_target_distribution.png - распределение целевой переменной (столбчатая диаграмма и круговая диаграмма)

09_heart_disease_features_distribution.png - распределения числовых медицинских показателей (age, trestbps, chol, thalach, oldpeak)

09_heart_disease_features_by_target.png - boxplot-диаграммы признаков в зависимости от наличия заболевания

09_heart_disease_correlation_bars.png - тепловая карта корреляций между признаками

09_heart_disease_demographics.png - анализ возраста и пола:

  • Распределение возраста
  • Распределение болезней по возрастным группам
  • Распределение возраста по полу и наличию заболевания

4. Статистика

Для каждого числового признака вычислены:

  • Среднее значение
  • Медиана
  • Стандартное отклонение
  • Минимум и максимум

5. Ключевые находки

  • Проанализирована корреляция признаков с целевой переменной
  • Выявлены топ-10 корреляций между признаками
  • Изучено распределение болезней по возрастным группам
  • Проанализирована зависимость от пола пациента

Файлы

  • assignment.py
    - основной файл с кодом анализа
  • README.md
    - этот файл с документацией
  • requirements.txt
    - список зависимостей Python
  • 09_heart_disease_target_distribution.png
    - график распределения целевой переменной
  • 09_heart_disease_features_distribution.png
    - графики распределений признаков
  • 09_heart_disease_features_by_target.png
    - boxplot-графики признаков по классам
  • 09_heart_disease_correlation_bars.png
    - тепловая карта корреляций
  • 09_heart_disease_demographics.png
    - графики демографического анализа

Удалены следующие файлы:

  • ASSIGNMENTS_README.md
  • CODE_REQUIREMENTS.md
  • MATPLOTLIB_CHEATSHEET.md
  • PANDAS_CHEATSHEET.md
  • CONTRIBUTING.md
  • FILE_UPDATE_REPORT.md