Дата-сайентист – специалист по обработке, анализу и хранению больших массивов данных. Он работает с Big Data с помощью комплекса инструментов, важное место, в котором занимают алгоритмы машинного (Mаchine Learning) и глубокого (Deep Learning) обучения. К первому относятся модели, которые обучаются самостоятельно или с наставником и, в большинстве случаев, требуют наличия структурированных данных. Ко второму – многослойные модели (нейронные сети), которые производят быстрый анализ и математические вычисления без наставника.
Использование нейронных сетей позволяет обрабатывать огромные наборы данных, решая сложные задачи, которые иногда невозможно решить стандартными методами машинного обучения.
Использование нейросетей в Data Science позволяет:
- распознавать речь, текст, изображения;
- визуализировать, переводить и проводить любую другую обработку информации;
- обнаруживать аномалии, например, мошенничество, ненормальное поведение клиента;
- создавать проекты машинного творчества;
- находить закономерности в больших массивах структурированной и неструктурированной информации;
- строить модели для оптимизации бизнеса. Например, прогнозирование и анализ эффективности бизнес-процессов, предсказание курса акций и других переменных персонализированного маркетинга.
В отличие от аналитиков, специалист по Data Science не только анализирует информацию, но и разрабатывает решения для бизнеса или научные проекты.
Университет искусственного интеллекта (УИИ) подобрал четыре преимущества, которые выделяют дата-сайентистов среди других IT-специалистов.
Высокая зарплата
По данным Headhunter.ru, средняя заработная плата дата-сайентиста – 140 тысяч рублей. Все зависит от набора умений, которые есть у специалиста: новички получают от 70-100 тысяч, специалисты уровня Middle-Senior – от 100 и более тысяч рублей. В США зарплаты еще выше: от $110-140 тысяч в год.
Востребованность
С 2010 года профессия считается одной из самых перспективных в мире. Каждый год число вакансий растет по экспоненте, причем не только в США и европейских странах, но и в России.
Дата-сайентисты нужны во всех сферах науки и бизнеса, например:
- в IT;
- в торговой;
- в финансовой;
- в медицинской;
- в промышленной.
И в десятках других отраслей. Современные стартапы уже невозможно реализовать без дата-сайентистов.
Интересный факт: по прогнозам аналитиков, через 10-20 лет любому менеджеру в компаниях среднего-крупного бизнесов понадобится как минимум базовое владение навыками Data Science.
Неограниченные возможности для роста
Новички в области Data Science могут ограничиться Matlab, SAS, SPSS или другими подобными инструментами и рассчитывать на зарплату в пределах 50 тысяч руб. Отсюда такой приток в профессию не столько от разработчиков и программистов, сколько от специалистов по анализу, ТОП-менеджеров в IT.
Однако наличие технических навыков – программирования, проектирования и использования нейронных сетей существенно повысит зарплату. Всему этому обучают в Университете искусственного интеллекта. Подробнее на вебинаре «День открытых дверей», который проводит основатель Университета Дмитрий Романов.
Возможность создать что-то действительно новое
От дата-сайентиста требуется постоянное развитие, умение создавать новые методы обработки, анализа и хранения данных, что требует креативности. Известен пример Джонатана Голдмана, который отучился в Стэнфорде на физика и устроился в LinkedIn. Пока остальные разработчики пытались повысить юзабилити сайта, он разработал предиктивную модель, которая показывала пользователям их возможных знакомых. Это принесло компании миллионы новых просмотров.
Без каких навыков не обойтись дата-сайентисту
- математическая логика, линейная алгебра и высшая математика – для построения моделей, поиска закономерностей, обучения нейросетей, составления отчетов;
- знание машинного и глубокого обучений – для настройки готовых или создания новых нейросетей. Понадобится знание AI-библиотек, например TensorFlow, Keras, PyTorch;
- программирование на Python, R, SQL. Первый больше других подходит для машинного обучения и нейросетей. Второй предназначен для статистического анализа. Третий необходим для работы с базами данных;
- умение искать информацию в разнообразных источниках, обрабатывать и визуализировать ее для наглядного предоставления результатов работы. Все это можно делегировать нейросетям.
Факт: в УИИ даются комплексные знания по Data Science с упором на написание разнообразных нейронных сетей и программирование на Python. Во время обучения проходят консультации по всем задачам, а после – выдается диплом о переквалификации и предлагается стажировка у партнеров, что существенно повысит шансы на дальнейшее трудоустройство.
С чего начать
Чтобы стать дата-сайентистом, вы можете:
- Заняться самообучением: есть бесплатные курсы от Гарварда, Вашингтонского университета. Понадобится уровень знания английского от Vantage or upper intermediate. На русском языке в открытом доступе информации меньше, к тому же она неструктурированная. На самообучение понадобится от 2 лет.
- Пойти в ВУЗ. В МГУ им. Ломоносова, МФТИ, НИУ, Школу анализа данных Яндекса. Срок обучения от 2 до 5 лет.
- Пойти на онлайн-курсы. Университет искусственного интеллекта (УИИ) проводит курсы как для опытных разработчиков, так и для новичков. Срок обучения от 6 месяцев. Программы включают в себя 26-38 вебинаров и практических заданий, написание курсовой и дипломной работ, которые можно использовать в портфолио.
Умение работы с нейронными сетями, навыки программирования, знание математики – все это делает профессию дата-сайентиста одной из наиболее востребованных в XXI веке.