Когда смотришь вакансии в IT, часто встречаются две похожие специальности: Data Scientist и Data Engineer. Обе работают с данными, но задачи у них принципиально разные. Одни строят модели, которые предсказывают будущее, другие создают инфраструктуру, без которой эти модели просто не на чем запустить. Разбираемся, кто есть кто, и как соискателю не ошибиться с выбором. Инженер данных занимается тем, что собирает, очищает и доставляет данные туда, где они нужны. Представьте, что компания – это огромный завод. Данные приходят с сайтов, мобильных приложений, касс, датчиков на производстве. Всё это сырьё. Задача инженера – построить трубы (пайплайны), по которым информация попадёт в хранилище, очистится от мусора и ляжет на полки в нужном порядке. Без него аналитики будут копаться в данных неделями или вообще не найдут то, что нужно. Инженер не решает бизнес-задачи, не строит прогнозы. Он отвечает за надёжность, скорость и качество данных. Его инструменты – SQL, Python, облачные платформы, с
Data Scientist и Data Engineer: в чём отличие и какую профессию выбрать
1 июня1 июн
5
3 мин