Дата-сайентисты — это исследователи. Они изучают сырые (необработанные) данные с помощью разных математических методов: создают модели машинного обучения или находят тренды и паттерны в используемых данных, чтобы разделить их на классы и сегменты, найти аномалии или выделить корреляции.
Аналитики данных интерпретируют результаты работы дата-сайентистов. Они помогают вырабатывать рекомендации касательно стратегии развития бизнеса, основанные на закономерностях, полученных в результате анализа данных. Для этого они строят графики и диаграммы, собирают их в дашборды — то есть представляют результаты анализа в наглядном виде.
Дата-инженеры, это специалисты, которые обеспечивают работу всей платформы по аналитике и обработке данных. Они строят инфраструктуры, соединяют модули, подключают источники, налаживают взаимодействие компонентов, разрабатывают процессы извлечения, обработки и загрузки данных.
Представим всех дата-специалистов, как команду корабля по исследованию космоса.
В ней есть капитан — директор или владелец компании, который задает общее направление поисков. Есть первый помощник — дата-аналитик, который на основе наблюдений дает капитану советы.
В поисках помогает ученый-исследователь и большой знаток инопланетных цивилизаций — дата-сайентист. А двигается экспедиция благодаря работе механика, который поддерживает работу всех систем корабля, в работе с данными ему соответствует дата-инженер.