Ggg
-- coding: utf-8 --
""" Platform Comparison Report
Заполненный шаблон на основе использования платформ Qwen, Perplexity и Deepseek для выполнения задания: Анализ частотности слов в датасете Wikipedia. """
============================================================================
СТУДЕНТ:
ЗАДАНИЕ: Анализ частотности слов в датасете Wikipedia.
ДАТА: 30.11.2025
============================================================================
Выбранные платформы для сравнения
Укажите 3 платформы:
-
Платформа 1: Qwen (Tongyi Qianwen)
- URL/Установка: https://qwen.ai/ или через Hugging Face / Alibaba Cloud
- Модель AI: Qwen-Max / Qwen-Plus (семейство Qwen, разработано Alibaba)
- Бесплатный лимит: Бесплатный веб-интерфейс с ограничением ~100–200 запросов/день; API требует регистрации, но есть пробный кредит
-
Платформа 2: Perplexity.ai
- URL/Установка: https://www.perplexity.ai/
- Модель AI: Варианты: Sonar (Perplexity-собственная), Claude, GPT-4 (в Pro-версии)
- Бесплатный лимит: Бесплатно до ~50–100 запросов/день (в зависимости от модели), без регистрации для базового режима
-
Платформа 3 (опционально): Deepseek
- URL/Установка: https://deepseek.com/ или через VS Code расширение
- Модель AI: Deepseek-Coder (специализированная для кода, 6.7B/33B параметров)
- Бесплатный лимит: Полностью бесплатный веб-интерфейс + VS Code интеграция без подписки
Критерии сравнения
1. Простота использования (1-5)
| Платформа | Оценка | Комментарий |
|---|---|---|
| Qwen | 4 | Чистый интерфейс, но требует регистрации; язык интерфейса — английский/китайский (автоперевод) |
| Perplexity | 5 | Очень интуитивный, похож на поисковик; сразу понятно, как задавать запросы |
| Deepseek | 4 | Отличный интерфейс, но ориентирован строго на код; для анализа датасета требуется более точная формулировка |
Итоговое наблюдение: Perplexity — самая интуитивная платформа благодаря поисковому стилю общения.
2. Качество генерируемого кода (1-5)
| Платформа | Оценка | Плюсы | Минусы |
|---|---|---|---|
| Qwen | 4 | Хорошая структура кода, поддержка pandas/NLTK, корректная обработка текста | Иногда пропускает импорты или предлагает устаревший синтаксис |
| Perplexity | 3 | Хорошо объясняет логику, но код часто фрагментарный | Не генерирует полный исполняемый скрипт; ориентирован на объяснение, а не реализацию |
| Deepseek | 5 | Идеальный код для задачи: полный скрипт с импортами, обработкой stop-слов, визуализацией | Меньше комментариев и пояснений — только код |
Итоговое наблюдение: Deepseek генерирует наиболее качественный и готовый к запуску код.
3. Скорость генерации (1-5)
| Платформа | Оценка | Время первого ответа | Время генерации 50 строк |
|---|---|---|---|
| Qwen | 4 | ~2–3 сек | ~6–8 сек |
| Perplexity | 5 | ~1–2 сек | Не применимо (редко генерирует 50+ строк кода) |
| Deepseek | 5 | ~1 сек | ~3–4 сек |
Итоговое наблюдение: Deepseek — самая быстрая платформа для генерации кода; Perplexity быстр, но не для длинных скриптов.
4. Понимание контекста (1-5)
| Платформа | Оценка | Примеры хорошего понимания | Ошибки в понимании |
|---|---|---|---|
| Qwen | 4 | Учёл, что датасет — Wikipedia, предложил использовать Wikipedia dump или sample | Иногда предлагал обработку HTML, хотя датасет был в текстовом формате |
| Perplexity | 5 | Понял цель — частотный анализ; предложил TF-IDF и word clouds как альтернативу | Не всегда учитывал ограничения (например, память при загрузке большого датасета) |
| Deepseek | 4 | Сразу предложил из + + | Не упомянул необходимость скачивания stopwords при первом запуске |
Итоговое наблюдение: Perplexity лучше всего понимает контекст задачи и цели, но не всегда учитывает технические нюансы.
5. Интеграция с инструментами (1-5)
| Платформа | IDE поддержка | Git интеграция | Тестирование | Отладка |
|---|---|---|---|---|
| Qwen | Частичная (через Alibaba Cloud IDE) | Нет | Нет | Нет |
| Perplexity | Нет | Нет | Нет | Нет |
| Deepseek | Да (VS Code, JetBrains) | Да (через IDE) | Частичная (предлагает тесты) | Частичная (объясняет ошибки) |
Итоговое наблюдение: Deepseek — лидер по интеграции с инструментами разработки.
6. Бюджет и доступность (1-5)
| Платформа | Доступность в РФ | Бесплатный план | Пробный период | Стоимость |
|---|---|---|---|---|
| Qwen | ✅ (через браузер) | ✅ | ❌ | Бесплатно для базового использования |
| Perplexity | ✅ | ✅ | ✅ (Pro-функции) | Бесплатно; Pro — ~$20/мес |
| Deepseek | ✅ | ✅ | ❌ | Полностью бесплатно (на момент 30.11.2025) |
Итоговое наблюдение: Все три платформы доступны в РФ и имеют бесплатные планы, но Deepseek — наиболее щедрый по функционалу без оплаты.
Финальное сравнение
Матрица оценок (сумма по всем критериям)
| Платформа | Общая оценка (max 30) | Рекомендация |
|---|---|---|
| Qwen | 24 | Хорош для баланса объяснений и кода |
| Perplexity | 25 | Лучше для понимания задачи, хуже для реализации |
| Deepseek | 28 | Лучший выбор для практического задания |
Заключение
Лучшая платформа для моего задания: Deepseek
Причины выбора:
- Генерирует готовый, исполняемый Python-код с обработкой текста и визуализацией
- Очень высокая скорость отклика и генерации
- Имеет интеграцию с VS Code — удобно для локального запуска и отладки
Где эта платформа может улучшиться:
- Добавить пояснения к коду (комментарии или отдельный блок с объяснением логики)
- Улучшить работу с большими датасетами (например, предложить chunked-чтение)
Другие интересные находки:
- Deepseek предложил использовать
+matplotlib.pyplotдля визуализации — это вышло за рамки ТЗ, но очень полезно.wordcloud - Perplexity автоматически искал актуальные источники датасетов Wikipedia (например, ссылку на Wikimedia dumps).
- Qwen иногда предлагал решения на китайском языке, но быстро переключался на английский по запросу.
Рекомендации для других студентов
На основе своего опыта, рекомендую:
- Для быстрого прототипирования: используйте Deepseek
- Для качественного кода: используйте Deepseek
- Для обучения (понимание AI-процесса): используйте Perplexity — он лучше всего объясняет «почему» стоит делать так, а не иначе.
