Найти в Дзене

Как стать специалистом по данным без диплома STEM

Введение

Будучи самоучкой, я могу с уверенностью сказать, что стать специалистом по анализу данных без диплома STEM очень даже возможно. Этот путь не будет легким, как не был легким он и для меня, но он стоил каждой унции усилий.

В этой статье я хочу поделиться четырьмя подробными советами о том, как стать специалистом по анализу данных без диплома STEM. С этими словами, давайте погрузимся в тему!

1. Изучите ПРАКТИЧЕСКИЕ основы науки о данных

Хотя "наука о данных" - это расплывчатое понятие, есть несколько основных навыков, которые я рекомендую вам освоить. Следующие навыки являются основополагающими для любого специалиста по анализу данных: SQL, Python, статистика, машинное обучение. Я также рекомендую вам изучать эти навыки именно в таком порядке. Это может показаться много, но это ничем не отличается от того, когда в колледже вам приходилось проходить 4-6 курсов за семестр!

Давайте рассмотрим каждый навык:

A) SQL

SQL - это язык данных и, пожалуй, самый важный навык для любого специалиста по анализу данных. SQL используется для манипулирования данными, анализа данных, создания информационных панелей, построения конвейеров, написания запросов для подачи в модели, и так далее по списку.

Учебник по SQL в режиме реального времени

Изучайте SQL (Codecademy)

B) Python и Pandas

Python (или любой другой скриптовый язык) служит основой для выполнения ряда других задач, таких как построение ML-моделей, веб-скрейпинг данных, создание автоматизированных скриптов и т.д.

Pandas - это библиотека Python, используемая для манипулирования данными и анализа. Лично я использую Pandas вместо SQL при исследовании данных в блокноте Jupyter.

Ниже приведены наиболее полезные ресурсы, которые я использовал для изучения Python и Pandas:

Введение в Python (Datacamp)

Учебник по изучению Pandas (Kaggle)

Практические задачи по Pandas (GitHub)

C) Статистика

Наука о данных/машинное обучение - это, по сути, современная версия статистики. Если вы сначала изучите статистику, вам будет гораздо легче изучать концепции и алгоритмы машинного обучения! Даже если может показаться, что в первые несколько недель вы не получите ничего ощутимого, это будет стоить того в последующие недели.

Ниже приведены наиболее полезные ресурсы, которые я использовал для изучения статистики:

Статистика и вероятность (Академия Хана)

StatQuest (YouTube)

Г) Машинное обучение

Машинное обучение не только интересно и увлекательно, но и является навыком, которым обладают все специалисты по работе с данными. Это правда, что моделирование составляет небольшую часть времени специалиста по анализу данных, но это не отменяет его важности.

Ниже приведены наиболее полезные ресурсы, которые я использовал для изучения машинного обучения:

Intro to Machine Learning (Kaggle)

Промежуточное машинное обучение (Kaggle)

Машинное обучение от А до Я (Udemy)

Машинное обучение - Стэнфорд (Coursera)

2. Выполните 1-3 личных проекта в области науки о данных

После того как вы заложили фундамент, лучшим способом ускорить процесс обучения будет выполнение нескольких проектов в области науки о данных. Самый простой способ сделать это - зайти на Kaggle, выбрать набор данных и создать модель прогнозирования или несколько визуализаций данных. Помните, что ваши первые несколько проектов не будут выдающимися! Но важно то, как вы прогрессируете со временем.

Вот несколько проектов по науке о данных, которые я выполнил в прошлом, и которые вы можете использовать для вдохновения!

Визуализация данных о коронавирусе с помощью Plotly

Прогнозирование цен на подержанные автомобили с помощью случайных лесов

Прогнозирование продолжительности жизни

Пока вы продолжаете учиться и практиковать свои навыки в области науки о данных, есть и другие вещи, которые вы можете сделать, чтобы стать более ценным кандидатом в области науки о данных, и это приводит меня к следующему совету:

3. Исследуйте нетрадиционные возможности для получения опыта

Самое сложное в работе специалиста по анализу данных - это получить первую возможность, не имея никакого опыта. Однако ниже перечислены несколько способов получить опыт, даже если у вас нет опыта:

Возможности некоммерческих организаций

Недавно я наткнулся на полезную статью, написанную Сьюзан Карри Сивек, в которой приводится несколько организаций, где вы можете получить возможность работать над реальными проектами в области науки о данных.

Если вы пытаетесь найти больше опыта для добавления в свое резюме, я настоятельно рекомендую вам ознакомиться с этой статьей.

Участвуйте в конкурсах

На мой взгляд, нет лучшего способа показать, что вы готовы к работе в области науки о данных, чем продемонстрировать свой код на соревнованиях. На Kaggle проводятся различные соревнования, в которых нужно построить модель для оптимизации определенной метрики.

Два конкурса, которые вы можете попробовать прямо сейчас, это:

Титаник: Машинное обучение после катастрофы

Цены на жилье: Продвинутые методы регрессии

Заведите блог на Medium

Да, я необъективен, но выслушайте меня. Вы удивитесь, узнав, сколько профессионалов, связанных с данными, ведут свой блог на Medium. Им нравится видеть информативные, проницательные и интересные материалы. Воспользуйтесь Medium, чтобы написать в блоге о своих знаниях, объяснить сложную тему на простом жаргоне или рассказать о своих проектах в области науки о данных!

В частности, я рекомендую вам писать для издания Towards Data Science, поскольку в настоящее время у них почти 500 000 подписчиков.

Если вы хотите вдохновиться, ознакомьтесь с моим проектом по прогнозированию качества вина.

4. Ищите работу, похожую на должность Data Scientist

Я знал, что мне предстоит нелегкая борьба, особенно без опыта работы в качестве специалиста по анализу данных. Однако поиск работы, схожей с должностью специалиста по анализу данных, значительно повысит ваши шансы стать специалистом по анализу данных. Причина этого заключается в том, что родственные вакансии дадут вам возможность работать с реальными данными в деловой среде.

Вот некоторые профессии, связанные с наукой о данных, которые вы можете найти:

аналитик бизнес-аналитики

аналитик данных

Аналитик по продуктам

Аналитик маркетинга роста / маркетинговый аналитик

Количественный аналитик

Спасибо за прочтение!

Я надеюсь, что эта статья была для вас полезной и поможет вам в вашей карьере специалиста по анализу данных!