team-work-ai-BendySonic

0
README.md

Student 1: BendySonic

Student 2: ecxqua

Student 3: Slava1111

Моя роль в качестве Student 2 выполнялась у ecxqua

📊 Анализ продаж в интернет-магазине

Этот проект реализует автономный Python-модуль для анализа данных о продажах, согласно техническому заданию из

.
Цель: заменить полноценный Django API простым, быстрым и корректным скриптом на
pandas
, который генерирует тестовые данные и создаёт три аналитических JSON-файла.

Репозиторий содержит решение учебной задачи по анализу данных продаж. Спецификация была сформулирована одним участником, реализация — другим, строго по требованиям, с помощью Qwen.

Задача была чётко выполнено вайб-кодингом благодаря подробной спецификации с уточнениями, но без излишних деталей реализации (кроме явного примера генерации датасета, что было важно уточнить, так как данные в готовом варианте поступают извне)

✅ Соответствие спецификации

Решение полностью соответствует требованиям из

codex.md
:

  • ✅ Используется только
    pandas
    , без Django, DRF или веб-слоя.
  • ✅ Поддерживается обработка 50 000+ строк за < 2 секунд.
  • ✅ Все даты обрабатываются как
    datetime
    с корректной фильтрацией.
  • ✅ Реализованы три обязательные функции:
    • get_sales_by_category()
      — выручка по категориям за 2024 год.
    • get_daily_statistics()
      — статистика за 25 декабря 2024.
    • get_customer_segments()
      — сегментация клиентов по общим тратам.
  • ✅ Обрабатываются граничные случаи:
    • отсутствие данных за дату → нулевые значения,
    • пропущенные
      NaN
      → строки удаляются при загрузке.
  • ✅ Генерация
    sales_data.csv
    встроена в скрипт — всё работает «по одной кнопке».

📦 Структура

analyze_sales.py # Единый исполняемый скрипт sales_data.csv # Автоматически генерируется при запуске *.json # Три выходных отчёта

⚙️ Что делает скрипт

При запуске:

  1. Генерирует
    sales_data.csv
    (50 000 строк, даты 2023–2025, 7 категорий, 10k клиентов)
  2. Загружает и чистит данные (удаляет NaN, приводит типы, парсит даты)
  3. Выполняет три аналитических задачи:
    • Выручка по категориям за 2024 год
      sales_by_category.json
    • Статистика за 2024-12-25
      daily_stats_2024-12-25.json
    • Сегментация клиентов (VIP / Regular / New) →
      customer_segments.json

Выручка считается как

quantity × price
. Все суммы округлены до 2 знаков.

▶️ Запуск

Требуется Python 3.8+ и библиотеки

pandas
,
numpy
:

Скрипт сам создаст данные и сгенерирует JSON-отчёты. Время выполнения — <2 сек.