Чем занимается дата-сайентист трудно понять сразу, но примерно ясно одно – что-то делает с данными. И, скорее всего, неплохо зарабатывает. Все так! Он строит и тестирует математические модели поведения больших данных с помощью машинного обучения, а сами цифры вытаскивает через SQL. Это помогает бизнесу снижать риски и повышать прибыль. К примеру, понять, какие товары будут популярны в следующем сезоне.
В статье понятно и подробно расскажем, что это за специалист и куда пойти учиться совсем без аналитических скилов (амбициозные гуманитарии, музыканты, врачи, юристы, мы приветственно машем вам ручкой 👋🏼).
В каких сферах востребован и что именно делает
Дата-сайентистам открыты любые сферы, потому что методы работы с данными универсальны. То есть это может быть хоть розничная торговля, хоть сложные научные проекты, где надо проводить исследования. Так, по данным Всемирного экономического форума, работа в Data Science занимает первое место в рейтинге профессий с самым большим спросом на рынке до 2025 года.
Пример задачки для дата-сайентиста. Заказчик хочет понять, будет ли спрос на новую коллекцию платьев. Что сделает специалист:
- подготовит данные о продаже платьев за последние несколько лет;
- выберет лучшую модель машинного обучения для такого прогноза;
- определится с метриками, которые наиболее точно оценят качество модели;
- напишет код модели;
- применит алгоритм машинного обучения на данных о прошлых продажах;
- получит прогнозные значения и предложит их менеджерам для принятия решения об объемах производства платьев.
Сколько может зарабатывать junior, middle и senior
Junior. Нуждается в более подробном ТЗ, многому учится уже в процессе. Обычно в пул задач входит подготовка данных и их простая обработка, устранение ошибок, построение сводных таблиц. Средняя зарплата – 100 000 рублей.
Все скриншоты вакансий от 8 августа 2022 года. Обращаем внимание, что вакансию взяли для примера, на момент прочтения статьи она уже может быть неактуальна.
Middle. Умеет виртуозно выполнять стандартные задачи, разбирается в машинном обучении и создании алгоритмов. Средняя зарплата – 260 000 рублей.
Senior. Умеет решать решать нетипичные задачи, обрабатывать большие данные и визуализировать результаты, работать со сложными фреймворками. Фреймворк – это ПО, которое облегчает разработку и объединение разных компонентов проекта.
А куда дальше по карьерной лестнице? Можно стать управленцем data-проектов или углубиться в узкую специализацию вроде обработки текста или изображений.
Какими навыками должен обладать любой дата-сайентист
Просим заранее не пугаться, если вам это покажется невероятно сложным. Всему реально научиться, об этом расскажем ниже.
Итак, надо очень дружить с математикой, чтобы строить математические модели: тут пригодятся линейная алгебра, теория вероятности, статистика и матанализ. Применять их на практике помогут Python, SQL, библиотеки готовых функций, объектов и подпрограмм, а также фреймворки для машинного обучения – NumPy и Scikit-learn. Для суперсложных задач понадобится язык С или C++. Визуализация результатов – в библиотеках Seaborn, Plotly или Matplotlib.
Но далеко не все завязано на hard skills. Личные качества тоже важны. Например, вы должны уметь критически мыслить и быть довольно общительны, потому что будет тесный коннект с командой и заказчиком. Это приемка задач, умение задать правильные вопросы, презентовать результаты. Еще точно не помешает любознательность – интересоваться разными сферами и более глубоко изучать бизнес-процессы.
Куда пойти учиться на дата-сайентиста
Cегодня не надо тратить по пять лет на желанное образование. Можно выбрать качественный курс c четко выстроенной системой.
К примеру, больше 6000 человек прошли этот курс от SkillFactory. За 24 месяца вы освоите профессию под присмотром опытных преподавателей-практиков. Да, все возможно с нуля, главное – просто следовать программе. Но давайте обо всем по порядку.
Учебная программа построена так, чтобы вы запоминали информацию максимально эффективно.
Например:
- Решение реальных бизнес-кейсов разной сложности до их вывода в продакшен.
- Закрепление знаний на практике, чтобы отработать навыки машинного обучения, взаимодействие с алгоритмами и временными рядами.
- Прокачка soft skills для перевода технических задач на простой и понятный бизнесу язык (и не только).
Чередование форматов тоже способствует лучшему запоминанию.
Что чередуем:
- Короткие видео, которые помогают быстро изучить текстовую выжимку из урока.
- Наличие конспектов по любой теме, с ними легче освежить лекции и сделать домашку.
- Специальные тренажеры, где можно отточить навыки до автоматизма.
- Тесты на проверку промежуточных знаний (куда без них).
- Онлайн-митапы с менторами (можно писать код в прямом эфире и сразу получать обратную связь).
Поддержка команды опытных наставников. Они проверяют и подробно комментируют ваши работы. А личный тьютор поможет не сойти с намеченного пути. То есть вы не предоставлены сами себе – на случай каких-то сложностей или вопросов, всегда есть к кому обратиться.
Познакомьтесь с экспертами курса:
Не нужно брать отпуск или, напротив, отказываться от путешествий на два года, здесь гибкий формат обучения. Выделяйте необходимое для учебы время в рамках вашей занятости.
В конце обучения у вас будет сертификат государственного образца. При желании можно перевести на английский.
А еще получите персональную помощь в поиске работы лидеров отрасли. Например, у таких, как «Билайн», «СБЕР», «Ростелеком», Skyeng и других. Вам помогут в составлении резюме и расскажут, как проходить собеседования.
Если решились покорить одну из самых высокооплачиваемых и интересных IT-профессий, переходите на сайт SkillFactory, читайте подробнее о курсе и смотрите его полную программу.