ML
10 месяцев назад
10 месяцев назад
README.md
Цель
Разработать классификатор, который определяет, является ли электронное письмо спамом или нет.
Инструкция по запуску ноутбука по классификации спама
Назначение файлов
— основной датасет с email-сообщениями и метками (data/spam.csv— ham,0— spam).1— Jupyter-ноутбук с полным циклом работы: предобработка текста, векторизация, обучение моделей, визуализация ROC-кривой и предсказания.notebooks/spam_classifier.ipynb— список всех Python-библиотек, необходимых для запуска ноутбука.requirements.txt— текущий файл с инструкциями по использованию проекта.README.md
Установка зависимостей
- Создайте виртуальное окружение:
- Запустите его:
для Linux/macOS:
Для Windows:
- Установите зависимости:
Запуск ноутбука
- Откройте терминал и запустите виртуальное окружение:
для Linux/macOS:
Для Windows:
- Запустите Jupyter Notebook:
-
Перейдите в директорию
и откройте файлnotebooks/.spam_classifier.ipynb -
Последовательно выполните все ячейки сверху вниз.
Для получения предсказания по новому тексту, необходимо запустить последние две ячейки в ноутбуке, где:
- Первая создает функцию дял предобработки текстовых данных.
- Вторая создает пайплайн и делает предсказание на примере текста.