training_projects
Учебные проекты Яндекс.Практикум по основам Data Science
В этом репозитории собраны все учебные проекты, выполненные в рамках курса Яндекс.Практикум "Специалист по Data Science". В результате было создано множество качественных моделей машинного обучения, неоднократно был произведен полноценный исследовательский анализ действительных данных.
Таблица для навигации по проектам
Проект | Описание | Используемые библиотеки |
---|---|---|
Определение стоимости автомобилей | Сервис по продаже автомобилей с пробегом «Не бит, не крашен» разрабатывает приложение для привлечения новых клиентов. В нём можно быстро узнать рыночную стоимость своего автомобиля. Нужно построить модель для определения рычноной стоимости авто. | pandas matplotlib seaborn numpy scikit-learn shap phik lightgbm catboost |
Определение токсичных комментариев (BERT) | Интернет-магазин «Викишоп» запускает новый сервис. Теперь пользователи могут редактировать и дополнять описания товаров, как в вики-сообществах. То есть клиенты предлагают свои правки и комментируют изменения других. Нужно создать модель, способную классифицировать комментарии на позитивные и негативные. | pandas matplotlib seaborn numpy scikit-learn pytorch transformers catboost lightgbm xgboost |
Прогнозирование заказов такси | Компания «Чётенькое такси» хочет привлекать больше водителей в период пиковой нагрузки. Нужно построить модель для прогноза количества заказов такси на следующий час. | pandas matplotlib seaborn numpy scikit-learn shap phik catboost statsmodels |
Оптимизация бизнес-решений при управлении персоналом компании "Работа с заботой" | HR-аналитики компании «Работа с заботой» помогают бизнесу оптимизировать управление персоналом: бизнес предоставляет данные, а аналитики предлагают, как избежать финансовых потерь и оттока сотрудников. Процесс принятия бизнес-решений следует оптимизировать при помощи машинного обучения: получится быстрее и точнее отвечать на вопросы бизнеса. Следует: 1. Построить модель, которая сможет предсказать уровень удовлетворённости сотрудника на основе данных заказчика. 2. Построить модель, решающую задачу бинарной классификации по увольнению сотрудника из компании. | pandas matplotlib numpy scikit-learn lightgbm shap phik |
Управление рисками и принятие решения о покупке коров хозяйства "Вольный луг" | Владелец фермы хочет купить бурёнок, чтобы расширить поголовье стада коров. Для этого он заключил выгодный контракт с ассоциацией пастбищ «ЭкоФерма». Условия позволяют фермеру очень тщательно отобрать коров. Он определяет качество молока по строгой методике, и при этом ему нужно выполнять свой план развития молочного хозяйства. Нужно разработать модель машинного обучения, которая поможет владельцу фермы управлять рисками и принимать объективное решение о покупке. | pandas matplotlib seaborn numpy scipy scikit-learn |
Выбор локации для скважины | Добывающей компании "ГлавРосГосНефть" нужно решить, где бурить новую скважину. Нужно построить модель машинного обучения, которая поможет определить регион, где добыча принесет наибольшую прибыль, и проанализировать возможную прибыль и риски техникой Bootstrap | pandas matplotlib numpy scikit-learn |
Прогнозирование оттока клиентов банка | Из «Бета-Банка» стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых. Нужно построить модель, которая будет способна спрогнозировать уход клиент из банка в ближайшее время. | pandas matplotlib scikit-learn |
Прогнозирование популярного продукта для интернет-магазина по продаже компьютерных игр | Интернет-магазин «Стримчик» продаёт по всему миру компьютерные игры. Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы. Нужно выявить определяющие успешность игры закономерности, чтобы сделать ставку на потенциально популярный продукт и спланировать будущие рекламные кампании, а также определить портреты пользователей в каждом регионе. | pandas matplotlib seaborn numpy scipy |
Описание
Сборник всех выполненных учебных проектов курса Яндекс.Практикум "Специалист по Data Science".
Языки
Jupyter Notebook