Data Scientist – специалист, который работает с большими данными. Это огромные объемы неструктурированной информации: статистика запросов в поисковых системах, результаты спортивных состязаний и многое другое. Для их обработки используется математическая статистика, машинное обучение и ценные знания дата-сайентиста.
Он может решать задачи, связанные с поиском лекарства от рака, спасать людей от возможных террористических атак, предсказывать рейтинг ресторанов, стоимость автомобилей и в целом помогать практически любому бизнесу стать лучше и зарабатывать больше. Сложно ли это? Да. Много ли денег получает такой специалист? Да. Можно ли этому научиться с нуля? Да.
В статье расскажем о том, какие знания и скилы необходимы на старте, какие открываются перспективы и какие тренды складываются вокруг этой профессии, а самое главное – как и где ей обучиться. Но давайте обо всем по порядку.
Какие личные качества помогут мне освоить профессию?
Вы любознательны. Желание учиться, задавать правильные вопросы и осваивать новые методы обработки данных – важное качество, которое помогает постоянно расширять аналитические возможности.
Вы внимательны к деталям. Небольшая ошибка в алгоритме может стать критической проблемой, которая приведет к неожиданным результатам анализа.
Вы умеете критически мыслить. Специалисту по данным нужно объективно анализировать информацию, чтобы доказать или опровергнуть гипотезу при решении реальной проблемы. В результате получается выработать четкое и рациональное представление о том, что делать. Такое мышление позволяет критически оценивать достоверность данных еще на этапе их сбора.
Вы креативны. Хотя наука о данных основана на логике, креативность позволяет изучать информацию под новыми, неисследованными углами. Нужно понимать, как можно по-разному управлять данными, чтобы генерировать больше вариантов, которые будут полезны бизнесу.
Вы эрудированны. Алгоритмы нужны не сами по себе, а в контексте бизнес-процессов. В конце концов, аналитик трудится для того, чтобы компания заработала больше денег. И Data Scientist должен понимать, что это за рынок, откуда идет доход и как в этом помогают модели, которые он создает.
Вы терпеливы. В процессе освоения профессии и самой работы неизбежны сбои, и именно терпение помогает сохранять позитивный настрой и в итоге находить самые оптимальные решения.
Хорошо, а что там с hard skills?
Освоить Data Science с нуля может любой упорный и целеустремленный новичок с остаточными школьными знаниями. Релевантное образование иметь не обязательно. Мы знаем успешных специалистов по данным из таких сфер, как экономика, биология, психология, физика и многих других.
Большинство направлений сейчас довольно-таки data-driven – везде есть данные, которые нужно анализировать, и везде нужны люди, которые умеют c ними работать.
Чтобы получить подходящий опыт, достаточно пройти хорошие курсы, где много практики и сжатая теория. Например, вот такие hard skills будут у каждого Data Scientist после прохождения онлайн-курса SkillFactory:
- IT-грамотность. Подтянутые технические скилы, программирование, придумывание и решение алгоритмических задач, владение софтом.
- Умение общаться со смежными специалистами, четко формулировать запросы. Если Data Scientist способен находить общий язык с разработчиками программ или инженерами, это огромный плюс, так как в крупных компаниях придется с ними взаимодействовать, чтобы, например, передвигать модели в продакшн.
- Математические и статистические знания. Это линейная алгебра, математический анализ, теория вероятности и статистика, использование NumPy и других библиотек Python для вычислений и построения моделей.
- Умение работать в команде и переводить с языка Data Science на простой человеческий. В процессе выполнения задач вы общаетесь с отделами финансов, продаж и прочими сотрудниками, которым порой нужно рассказать, как алгоритм работает на том или ином шаге.
- Опыт работы над интересными кейсами. В Data Science он намного важнее, чем специализированное образование, здесь ценится работа над конкретными проектами, потому что многие скилы можно получить и развить только в бою.
Вне курса точно не будет лишним выучить иностранный язык. Особенно если в перспективе вы стремитесь работать в США или Европе. Без знания английского, французского или немецкого – никак. При этом идеально разговаривать не нужно – вы должны говорить и писать на достаточном уровне, чтобы вас понимали коллеги.
Сколько мне будут платить?
Сильно зависит от страны и вашего уровня. Например, в большом исследовании Яндекс.Практикума и HeadHunter профессия Data Scientist находится в топе лидеров по размеру зарплаты.
Это усредненные значения, потому что не все компании сразу указывают оклад, а вакансии могут называться по-разному. Например, нам встречались такие, как аналитик Big Data, математик или математик-программист, менеджер по анализу систем и многие другие. Вы можете прийти на собеседование, поразить всех своими soft и hard skills и попросить чуть больше, чем в среднем по рынку.
Что касается Европы, в Нидерландах, например, Data Scientist уровня между junior и senior получает 3500–4500 евро чистыми в месяц + разные бонусы. Если говорить об уровне senior, это уже 5000–6000 на руки. В Америке оклады выше, но и условия жестче.
В Европе очень уважают личное время – пришел в 9:00, ушел строго в 17:00, и никто тебе ничего не скажет и не напишет по работе. В выходные – тем более. Кстати, обычно одного года опыта в этой сфере достаточно большинству местных компаний. Так что не оттягивайте момент, если хотите перебраться туда.
Круто! Теперь бы о карьерных перспективах почитать
Сегодня профессия на пике и очень востребована. Начинающих специалистов охотно берут именно в Data Science – доля вакансий для кандидатов с опытом работы меньше года здесь на четверть выше, чем в целом по рынку. Это и IT-компании, и производство, и медицина, и финансовые структуры, и телекомпании, и крупные торговые сети.
На первых этапах можно пойти на стажировку в крупную компанию – такие часто ищут стажеров, чтобы обучить их под себя:
Буквально за год работы вчерашний новичок может вырасти в полноценного Data Scientist и начать зарабатывать хорошие деньги.
Что касается карьерного роста, относительно недавно появилась ставка Chief Data Officer, senior level. Это потолок, когда можно дойти до руководителя всего подразделения Data Science. Такой человек понимает стратегию компании и знает, как ей развиваться в плане использования данных, чтобы быть конкурентоспособной на рынке через 5–15 лет.
Здесь уже недостаточно уметь делать таблички в MySQL – с этим справится любой разработчик. Нужно уметь работать со сложными и высоконагруженными системами, в которых правильно структурировать данные можно только с полным понимаем, как их будут использовать. Иногда специалисты по Data Science переходят в продакт – становятся Product Owner DS или Product Manager DS.
Важно понять, чем именно вам хочется заниматься, потому что в одних компаниях под Data Scientist больше подразумевают аналитика, в других – специалиста по ML, в третьих – кого-то, кто ближе к бизнес-аспектам. Обязательно спрашивайте об этом на интервью, чтобы заранее понимать свою роль и функции внутри компании и команды, иначе через пару месяцев удивитесь, что вместо разработки моделей с ML и выводом их в продакшн, вас взяли делать какие-нибудь BI-дашборды, а это глубокая пропасть.
Наверное, обучение очень дорогое и долгое (нет)
Чтобы освоить новую профессию, сегодня не нужно поступать в университет. SkillFactory разработали подробный онлайн-курс для будущих Data Scientist, который ведут лучшие преподаватели – они будут все проверять, комментировать и помогать с выполнением работ.
Курс подойдет новичкам без знаний в программировании и длится 2 года, или 4 семестра. «Боже, как долго, – подумаете вы. – Я видел, что этому всему учат за полгода!» К сожалению, так не бывает. Не зря в начале статьи расписаны все нюансы и размеры зарплат – вход в такую профессию не может быть коротким или слишком легким. Мы – даем вам все инструменты, вы – прилагаете максимум усилий, чтобы все получилось.
Уроки занимают всего 6 часов в неделю – вы спокойно можете совмещать учебу с работой и другими делами, заниматься в любой точке мира.
И это не только теория, хотя она тоже важна. Все полученные знания наши студенты отрабатывают на реальных задачах, которые потенциально могут возникнуть в разных компаниях. Например, вы будете работать над моделью, прогнозирующей дефолт клиента банка, чтобы помочь линейным специалистам избежать непоправимой ошибки при выдаче кредита. Или сможете улучшить качество школьного образования – здесь мы научим применять правила статистического анализа, искать корреляции, выделять самые важные переменные и визуализировать результаты.
То есть уже в процессе учебы вы соберете портфолио. И не нужно переживать, если вдруг возникнут трудности или вопросы – с вами на связи всегда будет персональный тьютор, который следит за прогрессом, вы можете общаться с менторами в рабочее время и круглосуточно делиться впечатлениями в сообществе единомышленников в Slack и на вебинарах.
Убедили! Как начать и сколько это стоит?
Чтобы познакомиться с онлайн-курсом SkillFactory поближе, переходите по ссылке и посмотрите, какие занятия вас ждут в каждом семестре. Цена более чем гуманная, а со скидкой – тем более. Используйте промокод ДЗЕН и получите скидку 50 % >>>