Найти тему
Researchee

Data Science. Сложнее всего начать?

Оглавление
Сложнее всего начать действовать, всё остальное зависит только от упорства.

Что будет, если выйти из своей зоны комфорта, ежедневной офисной рутины и попробовать что-то новое?

Введение

Об анализе данных слышал каждый, кто хоть как-то связан с миром IT. Согласно wiki:

Анализ данных - процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации и принятия решений.

В один ряд с анализом данных ставят науку о данных (data science) и машинное обучение (machine learning). Разобраться, что к чему, для новичка оказалось не так просто. Машинное обучения позволяет выявить закономерности, которые объясняют те или иные данные, а затем использует эти закономерности для предсказания новых данных. Науку о данных, в свою очередь, представляют как объединение статистики, анализа данных, машинного обучения и связанных с ними методов. Таким образом, наука о данных - понятие более широкое.

Наша активность не только в интернете, но и за его пределами оставляет за собой информационный след. Всё больше и больше компаний - начиная от операторов мобильной связи и банков, до фармацевтических компаний и сетевых продуктовых магазинов - собирают данные. Потому что knowledge is power. Выводы, сделанные в процессе анализа данных, позволяют принимать важнейшие решения.

Данные собираются, а значит нужны и те, кто сможет с ними работать. Поэтому спрос на специалистов в области анализа данных высок как никогда и продолжает расти. Другими словами, отрасль эта весьма перспективна.

Вернемся к автору:

  • бизнес-аналитик с опытом работы 5+ лет
  • без математического образования
  • без опыта программирования

желает погрузиться и развиваться в области анализа данных. Хватит ли упорства, будет ли интересно, и что из этого выйдет?

Обучение

В целом, анализу данных, как таковому, в российских университетах не обучают. На данный момент исключение составляет лишь одна известная мне магистерская программа, имеющая государственную аккредитацию - совместная программа Школы анализа данных (Яндекс) и Высшей школы экономики - "Наука о данных".

Безусловно, есть такие программы как прикладная математика и информатика, где студентам преподают дисциплины непосредственно связанные с анализом данных - математический анализ, линейная алгебра, теория вероятностей, программирование. С таким образованием было бы гораздо легче входить в мир анализа данных.

В моей ситуации университет давно окончен. Специальность предполагала несколько семестров высшей математики, знания которой были забыты за ненадобностью, и это максимум, который связывает меня с анализом данных. Предлагаю, также пренебречь курсом информатики в школе, хоть он и был достаточно интересен - всё-таки сколько лет уже прошло.

К счастью, сегодня огромное количество обучающих материалов находится в свободном доступе. Для себя выделяю следующие ресурсы:

  1. Онлайн-курсы - платформы coursera и stepik.
  2. Статьи, книги, учебники - для изучения отдельных тем.
  3. Друзья-программисты - на случай, если будет совсем сложно справиться с каким-то вопросом. Надеюсь, не бросят в беде :)

И главное помнить, теоретически знания - это хорошо, но если не уметь применять их на практике, то всё даром.

Добро пожаловать в блог начинающего аналитика.