Кому нужен Data Engineer, когда все остальные хотят нанять Data Scientist'а ? Позвольте мне начать с обыденной ситуации: новый увлеченный ds-специалист присоединяется к компании. Он умеет анализировать, строить модели и визуализировать результаты. Но тут до него доходит, что готовых данных нет и их надо из разнообразных хранилищ добывать, создавать пайплайн(что это такое почитайте здесь), в общем, сплошная головная боль. Желание работать, радоваться и жить полноценной жизнью постепенно пропадает, потому что данные бывают разные и структурировать их становится той еще задачей. И вот тут на сцену выходит data engineer. “Data engineer отвечает за создание, обработку и обслуживание ETL-пайплайнов, которые позволяют DS-специалистам уже без лишних усилий работать с чистыми данными”
Но не все компании понимают, что им требуются обе роли, и большую часть времени data scientist'ы в конечном итоге выполняют задачи по обработке данных, что мягко сказать не соответствует их профилю. Навыки Data