Data Science - что это?
На просторах интернета данное понятие всплывает весьма часто.
Так что же это такое?
Если совсем просто, Data Science - это наука о данных. Возросший интерес к этой науке относится к появлению парадигмы "больших данных" (Big Data).
К большим данным относятся данные соответствующие правилу "трёх V":
Volume - объём. От объёма данных зависит результат работы.
Velocity - скорость. Скорость поступления данных в реальном времени, а также скорость их обработки и получения результатов.
Variety - разнообразие. Возможность одновременной обработки разных типов структурированных и полуструктурированных данных. Например, посты в соцсетях - неструктурированные данные. А базы данных - пример структурированной информации.
К большим данным относятся: результаты спортивных состязаний, статистика запросов в поисковых системах, метеоданные, посты в соцсетях и многое другое.
Можно сказать, что Data Science - это сплошная математика. Она включает в себя теорию оптимизации, линейную алгебру, математическую статистику и другие области математики.
Также очень часто говорят о Data Scientist`ах.
Data Scientist - это специалист по анализу данных. Эти люди занимаются построением моделей с помощью алгоритмов машинного обучения. Но стоит сказать, что круг задач Data Scientist`а намного шире. Итог работы Data Scientist`а - прогнозная модель (это программный алгоритм, который находит оптимальное решение поставленной задачи).
Таким образом, чтобы работать в данной профессии, необходимо знать математику, математическую статистику, программирование, принципы машинного обучения, а также отрасль, в которой всё это будет применяться.
1 минута
11 сентября 2023