Ggg

0
4 месяца назад
5 месяцев назад
5 месяцев назад
5 месяцев назад
6 месяцев назад
3 месяца назад
4 месяца назад
6 месяцев назад
месяц назад
4 месяца назад
4 месяца назад
6 месяцев назад
6 месяцев назад
5 месяцев назад
4 месяца назад
4 месяца назад
6 месяцев назад
4 месяца назад
месяц назад
4 месяца назад
6 месяцев назад
5 месяцев назад
5 месяцев назад
6 месяцев назад
5 месяцев назад
4 месяца назад
5 месяцев назад
5 месяцев назад
3 месяца назад
3 месяца назад
3 месяца назад
6 месяцев назад
5 месяцев назад
5 месяцев назад
5 месяцев назад
5 месяцев назад
месяц назад
5 месяцев назад
4 месяца назад
6 месяцев назад
6 месяцев назад
6 месяцев назад
3 месяца назад
5 месяцев назад
3 месяца назад
4 месяца назад
4 месяца назад
4 месяца назад
6 месяцев назад
4 месяца назад
6 месяцев назад
4 месяца назад
5 месяцев назад
readme.md

-- coding: utf-8 --

""" Platform Comparison Report

Заполненный шаблон на основе использования платформ Qwen, Perplexity и Deepseek для выполнения задания: Анализ частотности слов в датасете Wikipedia. """

============================================================================

СТУДЕНТ:

ЗАДАНИЕ: Анализ частотности слов в датасете Wikipedia.

ДАТА: 30.11.2025

============================================================================

Выбранные платформы для сравнения

Укажите 3 платформы:

  1. Платформа 1: Qwen (Tongyi Qianwen)

    • URL/Установка: https://qwen.ai/ или через Hugging Face / Alibaba Cloud
    • Модель AI: Qwen-Max / Qwen-Plus (семейство Qwen, разработано Alibaba)
    • Бесплатный лимит: Бесплатный веб-интерфейс с ограничением ~100–200 запросов/день; API требует регистрации, но есть пробный кредит
  2. Платформа 2: Perplexity.ai

    • URL/Установка: https://www.perplexity.ai/
    • Модель AI: Варианты: Sonar (Perplexity-собственная), Claude, GPT-4 (в Pro-версии)
    • Бесплатный лимит: Бесплатно до ~50–100 запросов/день (в зависимости от модели), без регистрации для базового режима
  3. Платформа 3 (опционально): Deepseek

    • URL/Установка: https://deepseek.com/ или через VS Code расширение
    • Модель AI: Deepseek-Coder (специализированная для кода, 6.7B/33B параметров)
    • Бесплатный лимит: Полностью бесплатный веб-интерфейс + VS Code интеграция без подписки

Критерии сравнения

1. Простота использования (1-5)

ПлатформаОценкаКомментарий
Qwen4Чистый интерфейс, но требует регистрации; язык интерфейса — английский/китайский (автоперевод)
Perplexity5Очень интуитивный, похож на поисковик; сразу понятно, как задавать запросы
Deepseek4Отличный интерфейс, но ориентирован строго на код; для анализа датасета требуется более точная формулировка

Итоговое наблюдение: Perplexity — самая интуитивная платформа благодаря поисковому стилю общения.


2. Качество генерируемого кода (1-5)

ПлатформаОценкаПлюсыМинусы
Qwen4Хорошая структура кода, поддержка pandas/NLTK, корректная обработка текстаИногда пропускает импорты или предлагает устаревший синтаксис
Perplexity3Хорошо объясняет логику, но код часто фрагментарныйНе генерирует полный исполняемый скрипт; ориентирован на объяснение, а не реализацию
Deepseek5Идеальный код для задачи: полный скрипт с импортами, обработкой stop-слов, визуализациейМеньше комментариев и пояснений — только код

Итоговое наблюдение: Deepseek генерирует наиболее качественный и готовый к запуску код.


3. Скорость генерации (1-5)

ПлатформаОценкаВремя первого ответаВремя генерации 50 строк
Qwen4~2–3 сек~6–8 сек
Perplexity5~1–2 секНе применимо (редко генерирует 50+ строк кода)
Deepseek5~1 сек~3–4 сек

Итоговое наблюдение: Deepseek — самая быстрая платформа для генерации кода; Perplexity быстр, но не для длинных скриптов.


4. Понимание контекста (1-5)

ПлатформаОценкаПримеры хорошего пониманияОшибки в понимании
Qwen4Учёл, что датасет — Wikipedia, предложил использовать Wikipedia dump или sampleИногда предлагал обработку HTML, хотя датасет был в текстовом формате
Perplexity5Понял цель — частотный анализ; предложил TF-IDF и word clouds как альтернативуНе всегда учитывал ограничения (например, память при загрузке большого датасета)
Deepseek4Сразу предложил
Counter
из
collections
+
re
+
nltk.corpus.stopwords
Не упомянул необходимость скачивания stopwords при первом запуске

Итоговое наблюдение: Perplexity лучше всего понимает контекст задачи и цели, но не всегда учитывает технические нюансы.


5. Интеграция с инструментами (1-5)

ПлатформаIDE поддержкаGit интеграцияТестированиеОтладка
QwenЧастичная (через Alibaba Cloud IDE)НетНетНет
PerplexityНетНетНетНет
DeepseekДа (VS Code, JetBrains)Да (через IDE)Частичная (предлагает тесты)Частичная (объясняет ошибки)

Итоговое наблюдение: Deepseek — лидер по интеграции с инструментами разработки.


6. Бюджет и доступность (1-5)

ПлатформаДоступность в РФБесплатный планПробный периодСтоимость
Qwen✅ (через браузер)Бесплатно для базового использования
Perplexity✅ (Pro-функции)Бесплатно; Pro — ~$20/мес
DeepseekПолностью бесплатно (на момент 30.11.2025)

Итоговое наблюдение: Все три платформы доступны в РФ и имеют бесплатные планы, но Deepseek — наиболее щедрый по функционалу без оплаты.


Финальное сравнение

Матрица оценок (сумма по всем критериям)

ПлатформаОбщая оценка (max 30)Рекомендация
Qwen24Хорош для баланса объяснений и кода
Perplexity25Лучше для понимания задачи, хуже для реализации
Deepseek28Лучший выбор для практического задания

Заключение

Лучшая платформа для моего задания: Deepseek

Причины выбора:

  • Генерирует готовый, исполняемый Python-код с обработкой текста и визуализацией
  • Очень высокая скорость отклика и генерации
  • Имеет интеграцию с VS Code — удобно для локального запуска и отладки

Где эта платформа может улучшиться:

  • Добавить пояснения к коду (комментарии или отдельный блок с объяснением логики)
  • Улучшить работу с большими датасетами (например, предложить chunked-чтение)

Другие интересные находки:

  • Deepseek предложил использовать
    matplotlib.pyplot
    +
    wordcloud
    для визуализации — это вышло за рамки ТЗ, но очень полезно.
  • Perplexity автоматически искал актуальные источники датасетов Wikipedia (например, ссылку на Wikimedia dumps).
  • Qwen иногда предлагал решения на китайском языке, но быстро переключался на английский по запросу.

Рекомендации для других студентов

На основе своего опыта, рекомендую:

  1. Для быстрого прототипирования: используйте Deepseek
  2. Для качественного кода: используйте Deepseek
  3. Для обучения (понимание AI-процесса): используйте Perplexity — он лучше всего объясняет «почему» стоит делать так, а не иначе.

alt text