team-work-ai-Martin11

0
5 месяцев назад
5 месяцев назад
5 месяцев назад
5 месяцев назад
5 месяцев назад
5 месяцев назад
README.md

Анализ образовательных данных — Проект

Общее описание

Данный проект реализует API для анализа учебных достижений студентов на основе наборов данных из Student Performance Dataset (Kaggle / UCI). Анализ ведётся без использования предсказательных моделей, с применением статистических методов.

Обрабатываются CSV-файлы с анонимизированными данными по студентам из разных лет, в которых отражены такие параметры, как: student_id, subject, score, attendance, semester, year и difficulty_level. Особое внимание уделено сохранению конфиденциальности студентов.


Структура проекта

Папка
spec/

  • codex.md: Спецификация API проекта.
    • Описывает три основных метода API:
      1. get_subject_statistics(year)
        — статистика по предметам и семестрам за указанный год.
      2. analyze_attendance_impact()
        — анализ корреляции посещаемости и оценок.
      3. compare_difficulty_levels(subject)
        — сравнение успеваемости по уровням сложности предмета.
    • Форматы входных CSV-файлов и выходных JSON-ответов.
    • Ключевые требования к API и данные об анонимизации.

Папка
dev/

Здесь находятся ключевые модули и файлы, отвечающие за работу API и логику анализа:

  • solution.py

    • Основной скрипт с классом
      StudentPerformanceAnalyzer
      , который загружает данные, проводит аналитические вычисления и предоставляет методы для API.
    • Использование Pandas для обработки данных и SciPy для статистических тестов.
    • Flask-приложение для запуска сервера API локально.
    • В коде реализованы методы:
      • Загрузка и очистка данных из CSV.
      • Подсчёт статистики по предметам и годам.
      • Корреляция посещаемости и оценок.
      • Сравнение результатов по уровням сложности.
    • Включены примеры sample-данных для тестирования.
  • urls.py

    • Конфигурация URL-адресов API для Django-приложения.
    • Маршруты для вызова трех основных API-вьюшек:
      • Статистика по предметам (с возможностью фильтрации по году).
      • Анализ влияния посещаемости.
      • Сравнение по уровню сложности предмета.
  • views.py

    • Реализация API-вьюшек с использованием Django REST framework.
    • Использование класса
      StudentPerformanceAnalyzer
      для получения данных и формирование ответов.
    • Обработка ошибок с соответствующими HTTP-статусами.

Папка
demo/

В этой папке находятся все вспомогательные и рабочие файлы с кодом, которые задействованы в реализации алгоритмов проекта.

Это центральное хранилище кода, обеспечивающего корректное выполнение процесса анализа образовательных данных и работу всего проекта в целом.


Запуск и использование

  1. Разместите данные CSV-файлы в папку
    data/
    (или создайте эту папку рядом с кодом).
  2. Запустите Flask-приложение из
    solution.py
    командой:
    python dev/solution.py
  3. Используйте API-запросы по URL из
    urls.py
    для получения статистики и аналитики.

Источники и ссылки


Соавторы: Иван Чернышев(ник: Flex) Александр Драчук(ник: Garfield)

Garfield - делал ревью(участник 3) Flex - создавал код(участник 2)

Я был участником №2 в проекте у Garfield