Найти в Дзене
Мечты об удаленке

Data science-что это такое и чем занимается дата-сайентист. Ответы на вопросы

Оглавление
Взято из открытых источников.
Взято из открытых источников.

Работа связанная с Data Science занимает одно из первых мест в рейтинге it-профессий, причем с самым большим спросом на мировом рынке труда. Вокруг этой профессии крутится достаточно много вопросов и даже мифов, особенно среди новичков, тех, кто только собирается осваивать эту профессию.

Мы подготовили отдельную статью, в которой ответим на самые частые вопросы, которые возникают у тех, кто собирается изучать Data Science. Надеемся, что будет полезно!

Data science - что это такое простыми словами

Что такое Data Science? Если говорить кратко и простыми словами, то это наука о данных, включающая в себя самые разнообразные технологии, инструменты и методики, с помощью которых дата-сайентист (часто говорят еще - саентист) проводит глубокий анализ огромных потоков информации для решения задач бизнеса.

Цель такой работы - найти нужное решение, опять же, для решения задач бизнеса.

Учитывая, что вся наша с вами жизнь, начиная с рождения, это бесконечный поток какой -либо информации (данных), то область применения дата-сайенти поистине огромна: ретейл, киберспорт, путешествия, образование, медицина — грамотный Data Scientist нужен практически в любой сфере.

Для наглядности, приведем простые примеры применения из жизни каждого из нас.

Примеры применения data science в нашей жизни

Пример № 1 - применение в банковской сфере

Использование Data Science в банковской сфере:

  1. Помогает оценивать потенциальных заемщиков.
  2. Верифицировать пользователей.
  3. Предотвращать многочисленные мошеннические операции.
  4. Проводить анализ показателей доходов заемщиков и прогнозировать спрос на наличные деньги в банкоматах.

Пример № 2 - использование в сфере логистики

Решения на основе Data Science в области логистики помогают:

  1. Эффективно планировать маршруты.
  2. Прогнозировать рентабельность грузоперевозок.
  3. Прогнозировать процент аварий из-за износа техники и оборудования.
  4. Обеспечивать безопасность закрытых объектов.

Пример № 3 - применение в социальной сфере

Так, например, компания Google уже создала рабочее приложение, которое позволяет людям с плохим зрением или вообще слепым, узнавать об объектах находящихся рядом с ними.

Приложение, созданное на основе Data Science, в реальном времени распознает на изображениях с уличных камер объекты и передает информацию слепому или слабовидящему.

Также, оно умеет зачитывать текст, видеть и озвучивать дорожные знаки, штрихкоды любых товаров и другие визуальные объекты.

Полезное применение? Еще бы! И это только некоторые примеры! На самом деле, можно взять любую отрасль из нашей жизни и там найдется место применению Data Science: сельское хозяйства, недвижимость, коммунальное хозяйство, медицина, пищевая промышленность и т.д.

Зачем нужны специалисты в data science

Взято из открытых источников.
Взято из открытых источников.

Без них невозможно обрабатывать огромные объемы неструктурированной информации. Именно дата-сайентисты и превращает ее в упорядоченный набор данных, который потом находит применение в нашей с вами жизни.


Еще, для наглядности, несколько примеров того, что могут полезного сделать специалисты Data Science:

  1. Предсказать, окупится ли новый бизнес-проект и стоит ли его начинать.
  2. Оценить будущий спрос на какие-либо товары и услуги.
  3. Улучшить и оптимизировать системы рекомендаций в соцсетях и различных сервисах.
  4. Помочь в создании приборов для автоматической постановки диагноза пациенту.
  5. Усовершенствовать транспортное движение и таким образом, сделать его более безопасным.
  6. Помочь построить систему распознавания лиц на улицах и в помещении и т.д.

Чем занимается Data Scientist

Взято из открытых источников.
Взято из открытых источников.

Он работает на стыке 3 разных направлений: программирования, машинного обучения и математики.

В основные обязанности любого дата-сайентиста входит сбор и анализ данных, построение моделей, их обучение и тестирование. Это специалист находит закономерности, дает прогнозы и предлагает лучшие решения в разных сферах нашей жизни.

Хороший Data Scientist должен разбираться в том, как работает компания и конкретная индустрия, в которой он занят.

Что должен знать каждый дата-сайентист

Если усеченно, то базовые навыки требуют следующих знаний:

  1. Умение писать код, обычно на языке программирования Python.
  2. Умение работать с базами данных.
  3. Знание языка SQL.
  4. Владения инструментами для работы с большими данными, такими как: Hadoop, Spark, Hive, Kafka.
  5. Умения отлаживать код и готовить к выкатке в продакшен.
  6. Навыков работы с программами для визуализации и презентации результатов работы: PowerPoint, Shiny/Dash, Power BI, Tableau, Qlik.
  7. Знаний технологии машинного и глубокого обучения.

Взято из открытых источников.
Взято из открытых источников.

Не стоит пугаться такого большого объема непонятных для новичка знаний, всему этому учат. Освоить профессию за 2 года более чем реально! Можно пока начать с бесплатных уроков по Python. Он в любом случае вам пригодится.

Чем отличается аналитик данных от data scientista

Эти 2 профессии часто пересекаются, но несмотря на схожесть, имеют некоторые отличия. Так, аналитик данных – это специалист, который из данных получает практическую пользу.

Data scientist – это специалист, который умеет применять сложные методы обработки данных и понимает, как они устроены.

Еще отличия между этими двумя профессиями можно охарактеризовать так:

  1. Data scientist исследует и работает с данными из нескольких несвязанных источников, в то время как аналитик данных обычно рассматривает данные из одного источника, такого как, например, CRM-система.
  2. Аналитик данных будет решать конкретные вопросы, поставленные ему бизнесом, в то время как специалист по Data Science, будет формулировать вопросы, решение которых, принесут пользу бизнесу.

Сколько зарабатывает data scientist

Зарплаты очень приличные, особенно в Москве. В регионах конечно будет меньше, но и цены там тоже не такие как в столице. Так что разброс зарплат, на уровне жизни дата-сайентистов практически не сказывается.

Они могут позволить себе многое, о чем обычный работяга, к примеру, на заводе или работающий в пятерочке, даже и мечтать не может!

На какую зарплату можно рассчитывать? Конечно, все будет зависеть от вашего стажа, опыта и навыков, но примерные рамки по зарплате на 2023 год таковы:

  • без опыта или с небольшим опытом да 1 года - от 100 до 120 тысяч;
  • с опытом от 1 до 3 лет - до 150-160 тысяч рублей в месяц;
  • с опытом от 3 лет и более - до 300 тысяч и выше.

Думаете это неправда? Тогда очень рекомендуем вам прочитать одну из статей, опубликованных в популярном интернет-издании journal.tinkoff, которая так и называется:

Как живет дата-сайентист в Москве с зарплатой 174 000 ₽ в месяц.

Доходы, расходы и т.д. Очень честная статья-исповедь для тех, кто планирует осваивать эту профессию и возможно, переезжать в Москву.

Как стать data scientistom

Если хотите быстро и не изучая кучу лишнего/ненужного войти в профессию, то самый лучший способ - окончить полноценные онлайн-курсы по Data Science.

Займет это у вас 2 года жизни. Если для вас важен диплом государственного образца, то учитесь очно или в онлайн-школе, где есть возможность удаленно получить высшее образование и окончить магистратуру.

Такая возможность, например, есть в SkillFactory (по ссылке наша статья-обзор этой площадки). Там же, самый лучший выбор курсов по Data Science и самые выгодные цены на них.

Вообще, по статистике, около 70 % тех, кто получал профессию data scientista онлайн, делали это именно в SkillFactory. Мы не говорим про другие профессии, но это направление там традиционно очень сильное.💪

Нужна ли дата-сайентисту математика и в каком объеме

Взято из открытых источников.
Взято из открытых источников.

Не раз встречали утверждение, в том числе и у тех, кто предлагает обучающие курсы, что математика дата-сайентисту не нужна.

Это не так! Data Scienti - как раз одно из направлений в it, где без знаний математики никак не обойтись. Причем вам понадобятся не школьные знания, а гораздо более глубокие.

Более того, если вы после окончания курсов будете искать работу, то вас на собеседовании, почти наверняка, попросят решить ту или иную математическую задачу и в целом, будут проверять ваши знания математики.

В каком объеме будущему дата-сайентисту нужна математика? Самые важные разделы математики для Data Science — это:

  • линейная алгебра;
  • теория вероятностей и математическая статистика;
  • математический анализ и методы оптимизации;
  • временные ряды.

Если у вас за плечами технический ВУЗ, то вы наверняка в теме! Ну а если нет, то можно изучать все это при помощи репетиторов или остановить свой выбор на других профессиях где знания математики не столь критичны, например, подойдет веб-дизайн или что-нибудь, связанное с маркетингом. Вся информация о профессиях есть на нашем канале.

Подписывайтесь на наш телеграмм, в котором мы публикуем анонсы новых курсов, новости, акции и скидки на обучении более чем 50 российских онлайн-школ и вы всегда будете в курсе того, что происходит на российском рынке онлайн-образования!

Реклама. Информация о рекламодателе по ссылкам в статье.