team-work-ai-BendySonic
Student 1: BendySonic
Student 2: ecxqua
Student 3: Slava1111
Моя роль в качестве Student 2 выполнялась у ecxqua
📊 Анализ продаж в интернет-магазине
Этот проект реализует автономный Python-модуль для анализа данных о продажах, согласно техническому заданию из .
Цель: заменить полноценный Django API простым, быстрым и корректным скриптом на , который генерирует тестовые данные и создаёт три аналитических JSON-файла.
Репозиторий содержит решение учебной задачи по анализу данных продаж. Спецификация была сформулирована одним участником, реализация — другим, строго по требованиям, с помощью Qwen.
Задача была чётко выполнено вайб-кодингом благодаря подробной спецификации с уточнениями, но без излишних деталей реализации (кроме явного примера генерации датасета, что было важно уточнить, так как данные в готовом варианте поступают извне)
✅ Соответствие спецификации
Решение полностью соответствует требованиям из :
- ✅ Используется только
, без Django, DRF или веб-слоя.pandas - ✅ Поддерживается обработка 50 000+ строк за < 2 секунд.
- ✅ Все даты обрабатываются как
с корректной фильтрацией.datetime - ✅ Реализованы три обязательные функции:
— выручка по категориям за 2024 год.get_sales_by_category()— статистика за 25 декабря 2024.get_daily_statistics()— сегментация клиентов по общим тратам.get_customer_segments()
- ✅ Обрабатываются граничные случаи:
- отсутствие данных за дату → нулевые значения,
- пропущенные
→ строки удаляются при загрузке.NaN
- ✅ Генерация
встроена в скрипт — всё работает «по одной кнопке».sales_data.csv
📦 Структура
analyze_sales.py # Единый исполняемый скрипт
sales_data.csv # Автоматически генерируется при запуске
*.json # Три выходных отчёта
⚙️ Что делает скрипт
При запуске:
- Генерирует
(50 000 строк, даты 2023–2025, 7 категорий, 10k клиентов)sales_data.csv - Загружает и чистит данные (удаляет NaN, приводит типы, парсит даты)
- Выполняет три аналитических задачи:
- Выручка по категориям за 2024 год → sales_by_category.json
- Статистика за 2024-12-25 → daily_stats_2024-12-25.json
- Сегментация клиентов (VIP / Regular / New) → customer_segments.json
- Выручка по категориям за 2024 год →
Выручка считается как . Все суммы округлены до 2 знаков.
▶️ Запуск
Требуется Python 3.8+ и библиотеки , :
Скрипт сам создаст данные и сгенерирует JSON-отчёты. Время выполнения — <2 сек.