Найти в Дзене
Лукамерт

Data Science. Путь в профессию

Data Science уже долгое продолжает набирать популярность. Вы слышали о нем, но у вас остались вопросы? Тогда вы по адресу. Что это? Data Science изучает проблемы анализа, обработки и представления в наглядном виде данных различного вида. Data Scientist работает с данными и представляет собой среднее между статистиком и программистом. Всего выделяют два типа: 1. Чуть больше программист, чуть меньше статистик. В его компетенции входит непосредственное применение анализа данных в работе. Хорошим примером может быть Яндекс.Дзен, который выстраивает персональную ленту публикаций на основе анализа ваших данных. 2. Чуть больше статистик, чуть меньше программист. Его основная задача отчистить данные, привести их к пригодному для обработки виду, провести анализ и представить результаты. Уже сегодня Data Science становится полноценной профессией, но пока еще с низким порогом вхождения. Если хотите стать Data Scientist, сейчас самое время. Что нужно знать? В первую очередь, надо освоить язык про
Оглавление

Data Science уже долгое продолжает набирать популярность. Вы слышали о нем, но у вас остались вопросы? Тогда вы по адресу.

Что это?

Data Science изучает проблемы анализа, обработки и представления в наглядном виде данных различного вида. Data Scientist работает с данными и представляет собой среднее между статистиком и программистом. Всего выделяют два типа:

1. Чуть больше программист, чуть меньше статистик. В его компетенции входит непосредственное применение анализа данных в работе. Хорошим примером может быть Яндекс.Дзен, который выстраивает персональную ленту публикаций на основе анализа ваших данных.

2. Чуть больше статистик, чуть меньше программист. Его основная задача отчистить данные, привести их к пригодному для обработки виду, провести анализ и представить результаты.

Уже сегодня Data Science становится полноценной профессией, но пока еще с низким порогом вхождения. Если хотите стать Data Scientist, сейчас самое время.

Что нужно знать?

В первую очередь, надо освоить язык программирования. Популярными языками для анализа данных являются R и Python. О Python мы уже писали. Лаконичный, универсальный язык с большим количеством библиотек и многочисленным сообществом его поклонников. R скорее узко специализированный язык для анализа данных, но также не очень сложный в изучении (сегодня его учат даже экономисты в университете). Он позволяет работать с данными, легко считать основные статистические показатели, строить модели и визуализировать через графики. Если вы собираетесь использовать R, советуем установить RStudio. Но будьте внимательнее, часто требуется знание и Python, и R.

Собираетесь работать с Big Data? Тогда выучите дополнительно SQL - язык структурированных запросов. Его задача - получение, изменение и удаление элементов из базы данных. Выучить основы можно очень быстро при регулярных занятиях.

По Python, R, SQL в интернете много книг, памяток, онлайн-курсов. Вы без труда их найдете. Главное смотрите на авторов. Знание английского здесь важно, но не является обязательным - существует много источников на русском языке. Здесь есть подборка материалов.

Как было сказано выше, Data Scientist работает со статистикой и программированием, поэтому знание статистики также важно. Ознакомьтесь с базовыми понятиями и методами.

Если вам понравилось, подписывайтесь. С нами вы полюбите IT.