Найти в Дзене

Data Science - что это?


На просторах интернета данное понятие всплывает весьма часто.

Так что же это такое?

Если совсем просто, Data Science - это наука о данных. Возросший интерес к этой науке относится к появлению парадигмы "больших данных" (Big Data).
К большим данным относятся данные соответствующие правилу "трёх V":
Volume - объём. От объёма данных зависит результат работы.
Velocity - скорость. Скорость поступления данных в реальном времени, а также скорость их обработки и получения результатов.
Variety - разнообразие. Возможность одновременной обработки разных типов структурированных и полуструктурированных данных. Например, посты в соцсетях - неструктурированные данные. А базы данных - пример структурированной информации.

К большим данным относятся: результаты спортивных состязаний, статистика запросов в поисковых системах, метеоданные, посты в соцсетях и многое другое.

Можно сказать, что Data Science - это сплошная математика. Она включает в себя теорию оптимизации, линейную алгебру, математическую статистику и другие области математики.

Также очень часто говорят о Data Scientist`ах.

Data Scientist - это специалист по анализу данных. Эти люди занимаются построением моделей с помощью алгоритмов машинного обучения. Но стоит сказать, что круг задач Data Scientist`а намного шире. Итог работы Data Scientist`а - прогнозная модель (это программный алгоритм, который находит оптимальное решение поставленной задачи).

Таким образом, чтобы работать в данной профессии, необходимо знать математику, математическую статистику, программирование, принципы машинного обучения, а также отрасль, в которой всё это будет применяться.

1 минута