Найти в Дзене

Путь в Data Science[личный опыт]

Хочу поделиться опытом и знаниями, а также учебниками, полезными ссылками и так далее, которые помогли мне придти в эту профессию.

Придя в университет учиться программированию, я не понимал, зачем так много математических предметов. Но когда подвернулся шанс попасть в сферу анализа данных, я осознал, что без математики в целом никуда. Хороший бекграунд математических направлений: Линейная алгебра, теория вероятности и мат. статистика, мат. анализ и методы оптимизации, а также численные методы - все это необходимо для качественного освоения данной профессии.

Какие могут быть советы по этому поводу? Наверное, можно поискать учебники, либо краткое изложения материала просто в интернете. Каких-либо ссылок по математическому аппарату, к сожалению, дать не могу. Либо поискать курсы на coursera. Там либо прослушать лекции бесплатно, или если вы студент, то написать заявку на получения доступа к необходимому курсу.

Кстати, если не терпится приступить к изучению. То есть очень хорошая книга[изображение снизу]. Дает краткое введение в те мат. сферы, которые необходимы каждому специалисту.

-2

Прочитать можно первые 100+ страниц, а дальше пока рано.

Также профессия не может обойтись без языка программирования. Один из самых бурно развивающихся языков - python. Конечно, есть еще R, но я предпочел выбрать python за простоту и популярность. Зацикливаться прям на программировании на python для этой профессии, наверное, сразу не нужно. Посмотреть видосики в ютубчике будет достаточно, чтобы понимать концепцию языка, все остальное придет с опытом, когда Вы будете гуглить и искать необходимую информацию.

Сразу скажу, что лучше гуглить на английском языке, поэтому +- какой-никакой язык должен быть. Да и в целом он необходим по жизни.

Теперь переходим к учебникам и ссылкам полезным. Но прежде хочу сказать, что Data Science - это абстрактное название, которое включает множество направлений. К примеру, анализ данных, построение моделей машинного обучения, Big Data и другие.

В общем, после получения базы математической, стоит прослушать курсы Воронцова на ютубе. Это обязательно, это база, чтобы понимать смысл и устройства методов машинного обучения.

После уже можно перейти к обработке данных. И тут я посоветую вот эту книгу. Показываются основные операции работы с библиотеками pandas, numpy, matplotlib и другие, которые необходимы любому Data Science'тисту.

-3
Переписывайте код прям из учебника, учитесь, запоминайте операции. Делайте это для того, чтобы "набить руку".

Следующая книга очень красочная, имеет свой репозиторий в GitHub. Дает краткое описание работы моделей и демонстрирует код, который, конечно же, необходимо самому тоже попробовать.

Фото взято с сайта www.ozon.ru
Фото взято с сайта www.ozon.ru

Еще книга:

-5

Также ряд ссылок с coursera - Прикладные задачи в анализе данных. Тут можно записаться и прослушать первую неделю на тему "Временные ряды". Полезный материал и хороший пример дается, а также задание.

Также можно просто прослушать для понимая статических методов и некоторых терминов, и многие другие полезности - Исследование статических взаимосвязей.

Ну и такой базовый курс, который пройти лишним не будет - Введение в машинное обучение. Кстати, курс открыт, можно выполнять задания без планы или написания заявки.

Еще могу сказать по личному опыту, что сейчас требуют не только написание моделей или исследования данных, а знания Git'а, написания API, а также Docker'а.

По этому поводу могу вам порекомендовать канал, который простым языком рассказывает и, скажем так, в режиме онлайн показывает, как пользоваться вещами, которые я упомянул выше.

Ссылка на канал ютуба - тут.

На этом закончим. Все ссылки и книги связаны с методами машинного обучения. Если Вы хотите глубокое обучение, это уже самостоятельно, ибо я сам только начинаю это изучать. Всем спасибо.

На этом все. Было ли Вам полезно?