Найти в Дзене
ЭврикаХаб

Кто такой дата-сайентист, и почему сейчас это одна из самых востребованных профессий на рынке

Дата-сайентист— одна из самых востребованных профессий на рынке труда, и в общих чертах большинство представляет, что это человек, который работает с данными. Но что требуется от сегодняшнего школьника и студента, чтобы завтра он стал хорошим дата-сайентистом? Знания — безусловно. Практический опыт — непременно. Однако есть и более базовые моменты, которые могут подтолкнуть к выбору этой профессии. По мнению Михаила Петровского, руководителя академической программы SAS Россия/СНГ, хороший дата-сайентист должен… 1. Любить математику Сколько раз мы слышали от школьников и студентов: «Да зачем мне в жизни эта математика? Где она вообще может пригодиться»? Когда ребёнка учат арифметике или таблице умножения, таких вопросов не возникает, практическая необходимость вполне ясна. Но как только речь заходит о более сложных областях, они сразу же начинают появляться. Тем не менее математика лежит в основе дата сайенс — науки о данных, а дата сайенс — это база для построения современной реальност
Оглавление
Источник фото:  techpoint.org
Источник фото: techpoint.org

Дата-сайентист— одна из самых востребованных профессий на рынке труда, и в общих чертах большинство представляет, что это человек, который работает с данными. Но что требуется от сегодняшнего школьника и студента, чтобы завтра он стал хорошим дата-сайентистом? Знания — безусловно. Практический опыт — непременно. Однако есть и более базовые моменты, которые могут подтолкнуть к выбору этой профессии. По мнению Михаила Петровского, руководителя академической программы SAS Россия/СНГ, хороший дата-сайентист должен…

1. Любить математику

Сколько раз мы слышали от школьников и студентов: «Да зачем мне в жизни эта математика? Где она вообще может пригодиться»? Когда ребёнка учат арифметике или таблице умножения, таких вопросов не возникает, практическая необходимость вполне ясна. Но как только речь заходит о более сложных областях, они сразу же начинают появляться. Тем не менее математика лежит в основе дата сайенс науки о данных, а дата сайенс это база для построения современной реальности, пронизанной высокими технологиями и коммуникациями. Дата сайенс это связующее звено между теоретической математикой и контекстом реальности. Без реальности данные это просто набор чисел, но в правильной привязке к контексту они помогают людям делать мир технологичнее, «умнее» и инновационнее.

2. …или не любить математику

Мы только что сказали, что в основе дата сайенс лежит математика, но чтобы стать дата-сайентистом, вовсе не обязательно любить фундаментальную математику. Среди специалистов по анализу данных много людей с инженерным и даже с гуманитарным образованием, например, с лингвистическим.

Математические методы и компьютеры — это лишь инструмент, который дополняет, но никак не подменяет интеллект человека. Не случайно в английском языке сейчас широко используется альтернативная расшифровка аббревиатуры AI — не Artificial (искусственный) интеллект, а Augmented — дополненный, усиливающий. Иными словами, математическое образование подготавливает почву, компьютер является рабочим инструментом, а новые гипотезы, интересные модели и в результате инновации создаёт человек, в первую очередь за счёт своей любознательности, стремления принимать вызовы и искать ответы на сложные вопросы.

Источник фото: analyticsindiamag.com
Источник фото: analyticsindiamag.com

3. Быть многогранным

Инновации требуют разнообразия и многогранности, а инновации, построенные на основе данных, успешны только тогда, когда собраны разные данные, охватывающие как можно больше аспектов. Например, система компьютерного зрения для обнаружения рака кожи на ранних стадиях не будет полноценно работать, если данные в их основе лежат модели только для светлого типа кожи. Поэтому в процессе разработки важно учитывать, чтобы были представлены разные данные. И, в свою очередь, разработчик не должен быть предвзятым, от него требуется широта мышления, чтобы увидеть проблему с разных углов, с точки зрения разных пользователей и учитывать всё это при создании инноваций.

4. Отличать «хорошие» данные от «плохих»

Данные могут использоваться как во благо, так и во зло, и сегодня мы это прекрасно знаем. Сколько раз возникали судебные иски из-за незаконного сбора и использования личных данных, манипулирования информацией в соцсетях и так далее! Поэтому даже тем, кто не выбирает дата сайенс своей профессией, очень важно быть критически настроенным потребителем данных — а в современном мире мы все так или иначе выступаем и генераторами, и потребителями данных.

При этом опытному, критически настроенному пользователю проще сделать один шаг вперед и заставить данные работать во благо уже в качестве дата-сайентиста. Это тоже задачи дата сайенс —с помощью данных создавать системы оперативного реагирования на стихийные бедствия, способствовать преодолению кризиса, связанного с пандемией, оптимизировать системы здравоохранения, — словом, строить более удобный и безопасный мир.

5. «Говорить на двух языках»

Поскольку цифровые технологии сегодня повсюду, компании ищут людей, которые, с одной стороны, владеют предметными знаниями, а с другой —способны на основе данных создавать новые знания. Иными словами, это люди, которые «говорят на двух языках».

Без знаний из предметных областей дата-сайентисты не смогут полноценно решать типичные задачи — «Где находятся уязвимости?», «Где искать данные?», «Как выглядят потенциальные решения?», «Что они значат для разных групп аудитории» и так далее.

Эффективное решение задачи начинается с понимания сути проблемы, и только после этого применяются методики и стратегии для поиска решения. Проще говоря, люди, сочетающие знания предметной области со знаниями в области анализа данных, остро востребованы на рынке труда — их желают видеть у себя в штате компании из самых разных отраслей.

Автор: Михаил Петровский, руководитель академической программы SAS Россия/СНГ

-3