code-review-101-jimbeez

0
README.md

Анализ датасета рукописных цифр

Информация о рецензируемых работах

GitVerse профили

https://gitverse.ru/jimbeez

Информация о студенте

  • ФИО: Бармин Егор Сергеевич
  • Группа: РИ-150921
  • Номер задания: 10

Описание задания

Что нужно анализировать: Датасет рукописных цифр (Digits) - многоклассовая классификация

Выполненные работы

Загрузка данных

  • Загружен датасет Digits из sklearn
  • Преобразован в DataFrame с 64 признаками-пикселями
  • Добавлена целевая переменная - цифры 0-9

Анализ целевой переменной

  • Распределение по цифрам примерно равномерное
  • Каждая цифра представлена 174-183 примерами
  • Процентное соотношение: 9.7%-10.2% на класс

Анализ признаков

  • 64 пиксельных признака
  • Значения пикселей от 0 до 16
  • Средняя интенсивность: 2.96

Визуализация

  • Графики распределения цифр
  • Примеры изображений каждой цифры
  • Анализ интенсивности пикселей
  • Тепловые карты средних изображений

Статистика

Таблица с метриками

МетрикаЗначение
Количество примеров1797
Количество признаков64
Количество классов10
Среднее значение пикселей2.96
Стандартное отклонение4.52

Ключевые числа

  • Минимум пикселя: 0
  • Максимум пикселя: 16
  • Баланс классов: ±3% от среднего

Ключевые находки

  1. Датсет хорошо сбалансирован по классам
  2. Пиксели в основном темные (низкие значения)
  3. Каждая цифра имеет уникальный паттерн в тепловых картах
  4. Распределение значений пикселей неравномерное

Выводы из анализа

  • Данные готовы для обучения моделей классификации
  • Отсутствует дисбаланс классов
  • Признаки требуют минимальной предобработки
  • Визуализация подтверждает различия между цифрами

Файлы

Созданные файлы

  • main.py
    - основной код анализа
  • 10_digits_target_distribution.png
    - распределение цифр
  • 10_digits_sample_images.png
    - примеры цифр
  • 10_digits_pixel_analysis.png
    - анализ пикселей
  • 10_digits_mean_heatmaps.png
    - тепловые карты
  • README.md
    - данный отчет

Удалённые файлы

  • Отсутствуют

🆕 Новые Файлы

✅ ASSIGNMENTS_README.md

  • Полная документация по заданиям
  • Структура и требования
  • Инструкции по использованию

✅ CODE_REQUIREMENTS.md

  • Обязательные функции
  • Требования к коду
  • Стандарты PEP8

✅ PANDAS_CHEATSHEET.md

  • Шпаргалка по pandas
  • Примеры операций
  • Tipи трюки

✅ MATPLOTLIB_CHEATSHEET.md

  • Шпаргалка по визуализации
  • Примеры графиков
  • Параметры

🔄 Обновлены Существующие Файлы

✅ Все *_full_analysis.py файлы

  • Добавлены временные метки
  • Несущественные изменения
  • Для отслеживания обновлений

📊 Статистика

  • Новых файлов: 4
  • Обновлено файлов: 10
  • Время выполнения: 2025-11-21 05:38:05

✅ Статус

Все файлы успешно созданы и обновлены