Аналитик данных: основные задачи и навыки
Аналитиком данных называют человека, который занимается сбором, обработкой, изучением и интерпретацией полученной информации. На основе его выводов принимаются решения по дальнейшему развитию бизнеса. Например, это может быть сокращение издержек на производстве, адаптация к изменчивым условиям рынка, выпуск новых товаров.
Любой стартап заинтересован в услугах data analyst, так как его работа позволяет минимизировать финансовые риски — в том числе при разработке новых продуктов, дополнений для существующих приложений.
Дата-аналитик:
- анализирует базы данных;
- находит взаимосвязи между различными процессами;
- проводит А/В-тестирование;
- занимается построением моделей для оценки перспектив и прогнозирования результатов без использования инструментов машинного обучения (ML, machine learning).
Аналитику приходится работать с огромными массивами информации. По статистике, собранной компанией Statista, в 2025 году общий объем данных по всему миру превысит 180 зеттабайт. Для наглядности: чтобы сохранить 1 зеттабайт сведений, потребуется порядка 83 млн жестких дисков, объемом 12 терабайт каждый. Если измерять в смартфонах с памятью 32 ГБ, то их число составит около 34,4 миллиарда устройств.
Очевидно, что ориентироваться в таком масштабном потоке данных даже при условии, что собираться они будут в ограниченных пределах, очень сложно. Поэтому профессия data analyst становится все более востребованной в различных компаниях. Чаще всего в услугах таких специалистов заинтересован средний и крупный бизнес, где от результатов анализа напрямую зависят решения по дальнейшему масштабированию и продвижению.
Задачи и навыки дата-аналитика
Уровень требований к специалисту зависит от его знаний и опыта.
- Junior занимается поиском, сбором, обработкой и интерпретацией данных. Также он отвечает за подготовку отчетности и простой визуализации.
Примеры задач:
- определить среднюю стоимость бархатных штор на основе сравнительного анализа цен конкурентов;
- рассчитать, какую конверсию можно будет получить с сайта после внедрения чат-бота.
- Middle знает, как можно выявить те или иные закономерности при исследовании определенных показателей, умеет прогнозировать результаты принятых решений.
Примеры задач:
- предложить новые ниши развития для компании по строительству коттеджных поселков в условиях финансового кризиса и высоких ипотечных ставок у банков;
- выявить причины оттока клиентов сети пиццерий к конкурентам, недавно вышедшим на рынок.
- Senior — специалист высокого уровня, который умеет строить и проверять гипотезы, проводить сложные аналитические исследования, а также может выступать в качестве руководителя команды аналитиков.
Примеры задач:
- провести анализ и сегментацию целевой аудитории сети торговых центров в Башкирии для оптимизации рекламной кампании;
- обеспечить полную аналитику курсов по обучению удаленным профессиям для онлайн-школы международного уровня.
Аналитики данных востребованы в разных сферах и отраслях. Например, в медицине такие специалисты могут заниматься анализом качества услуг, в университете — отвечать за сбор статистики по местам работы выпускников.
Data scientist: навыки и обязанности
Data scientist — это специалист, который с помощью ML занимается созданием инструментов для решения различных задач. Например, это может быть разработка чат-бота для службы поддержки гипермаркета, обучение голосового помощника, поиск ранее неизвестных геоглифов.
Сфера деятельности data scientist объединяет в себе знания по построению моделей машинного обучения, разработке ПО, классическому анализу данных. В отличие от аналитика, такой человек умеет строить модели на основе визуализации данных, проведенных исследований, алгоритмов ML.
Основные обязанности data scientist:
- сбор, очистка и анализ данных;
- построение моделей с учетом специфики бизнеса или отрасли, для которой ведется разработка проекта;
- обучение моделей и проверка того, как они будут работать в реальных условиях.
Очистка данных — один из наиболее важных блоков в работе дата-сайентиста. С одной стороны, она представляет собой выборку нерелевантной и однотипной информации, которая способна перегрузить прогнозную модель. С другой стороны, специалист должен включить в систему максимально возможное количество факторов влияния — это обязательное условие для построения эффективной рабочей модели с высокой точностью прогноза.
С помощью построенных data scientist моделей можно спрогнозировать спрос на новый товар, объем квартальной выручки, реакцию голосового помощника Алисы на разные просьбы и даже отладить работу светофоров.
Data scientist должен знать языки программирования Python и SQL, уметь работать с инструментами внедрения и поддержки машинного обучения. Кроме того, специалисту необходимо хорошо понимать бизнес-процессы предприятия или специфику отрасли, для которой он ведет разработку проекта.
В чем сходство и различие профессий аналитика данных и data scientist
Аналитик — анализирует прошедшие события, например, поведение посетителей сервиса аренды фототехники. Затем на основе аналитических данных он находит взаимосвязь с определенными показателями и предлагает решения по повышению их эффективности. То есть основной фокус работы направлен на интерпретацию данных.
С другой стороны, data scientist уделяет значительную часть времени очистке данных и поиску корреляций между блоками информации. Специалисты этого профиля используют алгоритмы машинного обучения для поиска скрытых закономерностей в текущих процессах, разработки моделей и построения прогнозов в результате принятия конкретных решений. В процессе работы дата-сайентист может использовать наработки аналитика для обучения и отладки модели прогнозирования.
Оба специалиста решают одну задачу: определяют перечень мер, способных повлиять на рост продаж или другую цель прогнозирования. Но подходы у них разные.
Например, компания продает дождевики и резиновые сапоги, то есть сезонный товар. Аналитик может провести анализ продаж, на его основе построить сезонную кривую и сделать соответствующие выводы. Data scientist может изучить поведение посетителей на сайте и на основе этой информации составить кривую с повторным циклом, которая будет отличаться от представленной data analyst зависимости.
Сочетание этих двух методов позволит компании выстроить грамотную маркетинговую стратегию по запуску рекламных кампаний и улучшению юзабилити сайта. Бизнес повысит эффективность взаимодействия с клиентами сразу с двух сторон, что обеспечит рост продаж его сезонных товаров.
Таким образом можно сказать, что обе профессии — это два направления одного процесса. Более того, в настоящее время границы между этими специальностями постепенно размываются. Например, в ряде компаний от аналитика требуют знание Python и SQL.
Дата-аналитики не используют прогнозное ML-моделирование, то есть построение моделей, основанных на методах машинного обучения. Это — прерогатива data scientist.
Однако в ряде компаний к data analyst предъявляются требования практически на уровне data scientist. Поэтому при поиске подходящих вакансий соискателям имеет смысл изучить предложения по обоим направлениям.
Сравнение навыков
Мы подготовили сравнительную таблицу профессий в их классическом понимании. Однако напоминаем, что ряд компаний из-за путаницы в терминах может предъявлять к аналитику требования, схожие с обязательными навыками сайентиста.
Навык | Data scientist | Data analyst |
Знание языков программирования | Обязательно, в том числе Python, SQL | Необязательно, но работодатели часто требуют навыки работы с Python, SQL |
Математика, статистика | Обязательно | Обязательно |
Знание ML, Deep Learning | Обязательно | Не требуется |
Визуализация | Требуется | Требуется |
Дата-аналитики в основном оттачивают свои навыки во время обучения на курсах и участия в реальных проектах. Сайентисты, помимо этого, могут получить опыт, участвуя в хакатонах. Некоторые работодатели используют хакатоны как инструмент рекрутинга. То есть такие соревнования в том числе выступают альтернативным способом получить должность в крупной компании.
Оба специалиста — и data analyst, и data scientist — имеют достаточно широкие возможности профессионального роста. Внутри каждой профессии есть несколько ступеней развития от Junior до Senior. Кроме того, аналитик может изучить ML и стать сайентистом, а data scientist — вырасти до тимлида или главного специалиста по данным.