Найти в Дзене
Irene's Game

Кого берут в Датасаентисты? Знания и навыки, необходимые для Data Science

В одном из прошлых постов я уже начала рассказывать об одной из самых соблазнительных профессий в IT сейчас - Data Science. Сегодня поговорим о навыках, необходимых для Data Science. Начнем с программирования на языке Python. Также используется язык R, но для начала можно обойтись Python - он получил наибольшее распространение в данной области. Но, в зависимости от того, где вы будете работать, может понадобиться и R. Эти языки используются для написания моделей машинного обучения - Machine Learning. Поэтому нужно делать уклон именно в эту область. Соответственно, нужно знать специализированные библиотеки Machine Learning. И как вообще происходит процесс программирования - написания моделей в данном случае. Что такое фреймворки, библиотеки, какие существуют среды для программирования, как сохраняется код? - такие базовые знания программиста. Язык программирования SQL для запросов к системам хранения данных и работы с ними. Как устроены базы данных. Data Science одна из тех областей IT
Моя иллюстрация
Моя иллюстрация

В одном из прошлых постов я уже начала рассказывать об одной из самых соблазнительных профессий в IT сейчас - Data Science. Сегодня поговорим о навыках, необходимых для Data Science.

Начнем с программирования на языке Python. Также используется язык R, но для начала можно обойтись Python - он получил наибольшее распространение в данной области. Но, в зависимости от того, где вы будете работать, может понадобиться и R.

Эти языки используются для написания моделей машинного обучения - Machine Learning. Поэтому нужно делать уклон именно в эту область. Соответственно, нужно знать специализированные библиотеки Machine Learning. И как вообще происходит процесс программирования - написания моделей в данном случае. Что такое фреймворки, библиотеки, какие существуют среды для программирования, как сохраняется код? - такие базовые знания программиста.

Язык программирования SQL для запросов к системам хранения данных и работы с ними. Как устроены базы данных.

Data Science одна из тех областей IT, где нужна математика: линейная алгебра, математический анализ, комбинаторика, основы теории вероятности.

Также нужно знать статистику и бизнес метрики. KPI, A/B тестирование.

Нужны будут методы визуализации данных.

Один из ключевых компетенций Датасаентиста - знание методов Machine Learning. Обучение с учителем, обучение без учителя, обучение с подкреплением.

И, конечно, софт-скилс.

Также могут понадобиться предметные знания в той области, где будет работать Датасаентист. Но эти знания могут приобретаться и в процессе работы.

Из всего перечисленного та или иная работа может требовать более глубоких знаний в какой-то из перечисленных областей.

Надеюсь, у меня получилось составить представление об основных навыках, необходимых для Data Science.