Введение
Будучи самоучкой, я могу с уверенностью сказать, что стать специалистом по анализу данных без диплома STEM очень даже возможно. Этот путь не будет легким, как не был легким он и для меня, но он стоил каждой унции усилий.
В этой статье я хочу поделиться четырьмя подробными советами о том, как стать специалистом по анализу данных без диплома STEM. С этими словами, давайте погрузимся в тему!
1. Изучите ПРАКТИЧЕСКИЕ основы науки о данных
Хотя "наука о данных" - это расплывчатое понятие, есть несколько основных навыков, которые я рекомендую вам освоить. Следующие навыки являются основополагающими для любого специалиста по анализу данных: SQL, Python, статистика, машинное обучение. Я также рекомендую вам изучать эти навыки именно в таком порядке. Это может показаться много, но это ничем не отличается от того, когда в колледже вам приходилось проходить 4-6 курсов за семестр!
Давайте рассмотрим каждый навык:
A) SQL
SQL - это язык данных и, пожалуй, самый важный навык для любого специалиста по анализу данных. SQL используется для манипулирования данными, анализа данных, создания информационных панелей, построения конвейеров, написания запросов для подачи в модели, и так далее по списку.
Учебник по SQL в режиме реального времени
Изучайте SQL (Codecademy)
B) Python и Pandas
Python (или любой другой скриптовый язык) служит основой для выполнения ряда других задач, таких как построение ML-моделей, веб-скрейпинг данных, создание автоматизированных скриптов и т.д.
Pandas - это библиотека Python, используемая для манипулирования данными и анализа. Лично я использую Pandas вместо SQL при исследовании данных в блокноте Jupyter.
Ниже приведены наиболее полезные ресурсы, которые я использовал для изучения Python и Pandas:
Введение в Python (Datacamp)
Учебник по изучению Pandas (Kaggle)
Практические задачи по Pandas (GitHub)
C) Статистика
Наука о данных/машинное обучение - это, по сути, современная версия статистики. Если вы сначала изучите статистику, вам будет гораздо легче изучать концепции и алгоритмы машинного обучения! Даже если может показаться, что в первые несколько недель вы не получите ничего ощутимого, это будет стоить того в последующие недели.
Ниже приведены наиболее полезные ресурсы, которые я использовал для изучения статистики:
Статистика и вероятность (Академия Хана)
StatQuest (YouTube)
Г) Машинное обучение
Машинное обучение не только интересно и увлекательно, но и является навыком, которым обладают все специалисты по работе с данными. Это правда, что моделирование составляет небольшую часть времени специалиста по анализу данных, но это не отменяет его важности.
Ниже приведены наиболее полезные ресурсы, которые я использовал для изучения машинного обучения:
Intro to Machine Learning (Kaggle)
Промежуточное машинное обучение (Kaggle)
Машинное обучение от А до Я (Udemy)
Машинное обучение - Стэнфорд (Coursera)
2. Выполните 1-3 личных проекта в области науки о данных
После того как вы заложили фундамент, лучшим способом ускорить процесс обучения будет выполнение нескольких проектов в области науки о данных. Самый простой способ сделать это - зайти на Kaggle, выбрать набор данных и создать модель прогнозирования или несколько визуализаций данных. Помните, что ваши первые несколько проектов не будут выдающимися! Но важно то, как вы прогрессируете со временем.
Вот несколько проектов по науке о данных, которые я выполнил в прошлом, и которые вы можете использовать для вдохновения!
Визуализация данных о коронавирусе с помощью Plotly
Прогнозирование цен на подержанные автомобили с помощью случайных лесов
Прогнозирование продолжительности жизни
Пока вы продолжаете учиться и практиковать свои навыки в области науки о данных, есть и другие вещи, которые вы можете сделать, чтобы стать более ценным кандидатом в области науки о данных, и это приводит меня к следующему совету:
3. Исследуйте нетрадиционные возможности для получения опыта
Самое сложное в работе специалиста по анализу данных - это получить первую возможность, не имея никакого опыта. Однако ниже перечислены несколько способов получить опыт, даже если у вас нет опыта:
Возможности некоммерческих организаций
Недавно я наткнулся на полезную статью, написанную Сьюзан Карри Сивек, в которой приводится несколько организаций, где вы можете получить возможность работать над реальными проектами в области науки о данных.
Если вы пытаетесь найти больше опыта для добавления в свое резюме, я настоятельно рекомендую вам ознакомиться с этой статьей.
Участвуйте в конкурсах
На мой взгляд, нет лучшего способа показать, что вы готовы к работе в области науки о данных, чем продемонстрировать свой код на соревнованиях. На Kaggle проводятся различные соревнования, в которых нужно построить модель для оптимизации определенной метрики.
Два конкурса, которые вы можете попробовать прямо сейчас, это:
Титаник: Машинное обучение после катастрофы
Цены на жилье: Продвинутые методы регрессии
Заведите блог на Medium
Да, я необъективен, но выслушайте меня. Вы удивитесь, узнав, сколько профессионалов, связанных с данными, ведут свой блог на Medium. Им нравится видеть информативные, проницательные и интересные материалы. Воспользуйтесь Medium, чтобы написать в блоге о своих знаниях, объяснить сложную тему на простом жаргоне или рассказать о своих проектах в области науки о данных!
В частности, я рекомендую вам писать для издания Towards Data Science, поскольку в настоящее время у них почти 500 000 подписчиков.
Если вы хотите вдохновиться, ознакомьтесь с моим проектом по прогнозированию качества вина.
4. Ищите работу, похожую на должность Data Scientist
Я знал, что мне предстоит нелегкая борьба, особенно без опыта работы в качестве специалиста по анализу данных. Однако поиск работы, схожей с должностью специалиста по анализу данных, значительно повысит ваши шансы стать специалистом по анализу данных. Причина этого заключается в том, что родственные вакансии дадут вам возможность работать с реальными данными в деловой среде.
Вот некоторые профессии, связанные с наукой о данных, которые вы можете найти:
аналитик бизнес-аналитики
аналитик данных
Аналитик по продуктам
Аналитик маркетинга роста / маркетинговый аналитик
Количественный аналитик
Спасибо за прочтение!
Я надеюсь, что эта статья была для вас полезной и поможет вам в вашей карьере специалиста по анализу данных!