Найти в Дзене

Подробнейшая дорожная карта для аналитика данных в IT в 2023 году

Оглавление

Приветствую вас, будущие айтишники!

Если вы читаете эту статью, то скорее всего, разделяете мою страсть к миру информационных технологий. Возможно, вас также привлекает высокий спрос на квалифицированных специалистов в данной отрасли, выгодные возможности трудоустройства, гибкость удаленной работы, возможность жить в любой точке мира и быть в курсе самых передовых технологических инноваций.

Если это так, то вы находитесь в правильном месте, потому что сегодня мы углубимся в тему того, как начать свое путешествие в мире IT в роли аналитика данных. Мы обсудим карьерные перспективы, траекторию обучения и подход к приобретению необходимых минимальных навыков и инструментов для старта. Предоставим минимум по 5 полезных ссылок на качественные бесплатные обучающие материалы по каждому рассматриваемому инструменту.

Кроме того, отдельно расскажем, сколько времени потребуется, чтобы освоить необходимый набор навыков, где учиться и как получить свой первый оффер с нуля.

Статья получилась большой, но очень интересной, особенно для начинающих аналитиков. Приступаем🔥
Аналитика данных - это искусство преобразования необработанных сложных данных в четкую и значимую картину, которую можно использовать для обоснования важных бизнес-решений
Аналитика данных - это искусство преобразования необработанных сложных данных в четкую и значимую картину, которую можно использовать для обоснования важных бизнес-решений

Прежде, чем приступить

Если вы решились начать свой путь в IT, то необходимо определиться с траекторией, по которой вы будете двигаться. И тут есть два варианта:

  • Провести самотестирования на тему профессиональной ориентации - определиться с направлением вашей будущей деятельности и приобрести платный курс от одного из ведущих образовательных учреждений в сфере онлайн-образования, заплатить, на минуточку, в районе 200 000 рублей, но взамен получить четко структурированную программу обучения, опытных преподавателей и наставников на всем пути обучения, сертификаты, подтверждающие ваше владение тем или иным инструментом или навыком, доступ к центру карьерных консультаций, большое комьюнити единомышленников и на выходе диплом установленного образца, который может повысить вашу привлекательность для потенциального работодателя (хотя это не всегда гарантировано).
Если этот вариант вас вполне устраивает - замечательно, но тем не менее все же рекомендуем ознакомиться с содержанием данной статьи для собственного развития, так как зачастую, тех материалов, которые предоставляют онлайн-курсы бывает недостаточно 🤔
  • Однако, если вы не готовы вкладывать значительные суммы денег в свое образование или просто не имеете средств, не отчаивайтесь, есть второй вариант. Мы живем в поистине замечательное время, когда доступ к Интернету делает нас всемогущими. Огромный океан полезной информации, доступной в Интернете, означает, что вам не обязательно тратить много денег, чтобы получать знания и навыки.
Самая мощная движущая сила успеха - это жгучее желание, подпитываемое мечтами. Поэтому, если вы действительно мечтаете стать аналитиком данных, действуйте, поскольку нет лучшего времени для начала, чем сейчас 😎

10 ключевых навыков аналитика данных

  1. Управление данными: сбор, организация, очистка и поддержка больших объемов данных
  2. Анализ данных: использование статистических методы, инструментов визуализации и других аналитических методов извлечения информации из данных
  3. Программирование: хорошее владение такими языками программирования, как Python, R, SQL и другими
  4. Критическое мышление: способность выявлять тенденции, закономерности и аномалии в данных и делать на их основе осмысленные выводы
  5. Коммуникация: сильные устные и письменные коммуникативные навыки важны для объяснения полученных данных как техническим, так и нетехническим заинтересованным сторонам
  6. Деловая хватка: понимание бизнеса и знание предметной области важно для представления результатов анализа данных в соответствующем контексте
  7. Креативность: способность подходить к проблемам творчески и непредвзято очень ценится при решении сложных проблем с данными
  8. Внимание к деталям: тщательная очистка и проверка данных необходима, чтобы избежать аналитических ошибок, которые могут привести к неверным результатам и выводам
  9. Непрерывное обучение: наука о данных и технологии являются быстро развивающимися областями, поэтому очень важно непрерывно обучаться и быть в курсе последних событий
  10. Сотрудничество: аналитики данных зачастую работают в командах, поэтому сильные навыки совместной работы очень важны

Дорожная карта аналитика данных в 2023 году

Важно отметить, что для изучения базовых инструментов в интернете доступно гораздо больше учебных материалов на английском языке. С целью приобщения вас к английскому языку, некоторые материалы мы будем предоставлять именно на английском, так как его знание необходимо для IT-специалиста. Если вам на первых этапах будет сложно, предлагаем использовать переводчик или субтитры к видео.
Дорожная карта аналитика данных (упрощенная версия)
Дорожная карта аналитика данных (упрощенная версия)

1. Excel

Процесс обучения, нацеленный конкретно на практику, с нуля до продвинутого уровня в среднем может занять от 20 до 40 часов

Кто бы что ни говорил, но даже в 2023 году Excel остается одним из важнейших инструментов в арсенале аналитика данных, который должен владеть им на продвинутом уровне, знать и уметь применять:

  • Функции для очистки и подготовки данных: удаление дубликатов, заполнение пустых ячеек значениями и согласованное форматирование данных
  • Инструменты визуализации данных: различные типы диаграмм и графики, а также функции условного форматирования, которые позволяют применять правила цвета и форматирования к данным на основе определенных условий
  • Сводные таблицы: создание, редактирование и форматирование
  • Статистический анализ: регрессия, корреляция и проверка гипотез
  • Макросы: создание и использование в редакторе Visual Basic for Applications (VBA)
  • Power Query: функции слияния и добавления таблиц, сведение и удаление данных, а также фильтрация и сортировка данных
  • Power Pivot: функции создания связей между таблицами, использование формул DAX для расчетов и создания иерархий

Полезные ссылки:
1. Подборка бесплатных курсов по Excel на Stepik (выбирайте на вкус и цвет, потребуется регистрация)
2.
Подробный список функций Excel по категориям
3.
Learn Excel - бесплатное онлайн-обучение Excel (без регистрации и смс, как говорится)
4.
Короткие видеоуроки Excel от Microsoft (не требует авторизации)
5.
Бесплатные курсы и учебные руководства по теме «Excel» (требуется регистрация)
6.
Полный курс по аналитике данных в Excel | Основные навыки для анализа данных в Excel | Упрощенное обучение (4-часовое видео на YouTube)

2. SQL

Процесс обучения, нацеленный конкретно на практику, с нуля до достаточного уровня в среднем может занять от 40 до 60 часов

SQL (Structured Query Language - язык структурированных запросов) - это язык программирования, используемый для управления данными и манипулирования ими в системах реляционных баз данных. Являясь аналитиком данных, хорошее понимание SQL необходимо для эффективного запроса и анализа данных.

Ключевые концепции и навыки, на которых следует сосредоточиться при изучении SQL в качестве аналитика данных:

  • Синтаксис SQL: начните с изучения основного синтаксиса и структуры запросов SQL. Это включает в себя понимание предложений SELECT, FROM, WHERE и GROUP BY, которые используются для извлечения данных из базы данных
  • Моделирование данных и проектирование баз данных. Понимание концепций моделирования данных и проектирования баз данных поможет вам эффективно создавать базы данных и управлять ими. Это включает в себя изучение нормализации данных, диаграмм сущность-связь и принципов проектирования баз данных
  • Оптимизация запросов. Понимание того, как оптимизировать запросы для повышения производительности, имеет решающее значение для эффективного анализа данных
  • Продвинутые концепции SQL. Как только вы освоите SQL на базовом уровне, вы сможете перейти к более сложным темам, таким как подзапросы, соединения, оконные функции и хранимые процедуры
  • Практика: лучший способ выучить SQL - это практиковаться. Попробуйте решать задачи и работать над проектами, которые включают запросы к базам данных с использованием SQL

Полезные ссылки:
1. Интерактивный тренажер по SQL на Stepik (потребуется регистрация, но оно того явно стоит)
2.
Учебник по SQL - полный курс по базам данных для начинающих (4-часовое видео на YouTube)
3.
Учебное пособие по SQL
4.
Памятка/шпаргалка по SQL
5.
Введение в SQL и работу с базой данных от Нетологии (бесплатно, регистрируетесь, записываетесь на курс и проходите в удобное время)
6.
Огромная подборка от коллеги по цеху (45 бесплатных курсов, тренажеров, тестов)

3. Python

Процесс обучения, нацеленный конкретно на практику, с нуля до необходимого уровня в среднем может занять от 160 до 200 часов

Перед тем, как приступить к изучению языков программирования, вам необходимо выбрать среду для разработки, установить и настроить ее (на ютуб вы найдете любые туториалы) для комфортной работы.

По моему субъективному мнению, на Python, для разработки лучше и удобнее всего использовать PyCharm, а для аналитики - Jupyter Notebook (удобен блочным выполнением кода).

Далее изучить концепцию системы управления версиями Git. Научиться пользоваться удаленным репозиторием, например я пользуюсь GitHub.

Python - популярный язык программирования, используемый аналитиками данных для обработки, анализа и визуализации данных. Ключевые концепции и навыки, на которых следует сосредоточиться при изучении Python для анализа данных в 2023 году:

  • Основы Python: прочная база для углубления в аналитику - основы синтаксиса и концепций программирования (переменные, типы данных, поток управления, функции и модули)
  • Обработка данных с помощью Pandas: Pandas - это библиотека Python для обработки и анализа данных. Используется для чтения, очистки, преобразования и управления данными. В нее входит работа с фреймами данных, группировка и агрегирование, слияние и объединение, а также работа с данными временных рядов
  • Визуализация данных с помощью Matplotlib и Seaborn: Matplotlib и Seaborn - это библиотеки Python для визуализации данных. Используются для создания различных типов визуализаций, таких как гистограммы, линейные диаграммы, точечные диаграммы и тепловые карты, и передачи информации из данных
  • Статистический анализ с помощью SciPy и StatsModels: SciPy и StatsModels - это библиотеки Python для научных вычислений и статистического анализа. Используются для выполнения статистических тестов, проверки гипотез и регрессионного анализа данных
  • Машинное обучение с помощью Scikit-Learn: Scikit-Learn - это библиотека Python для машинного обучения. Используется для создания моделей контролируемого и неконтролируемого обучения, включая регрессию, классификацию, кластеризацию и уменьшение размерности
  • Практика: лучший способ изучить Python для анализа данных - это практиковаться. Решайте задачи и работайте над проектами, которые включают в себя манипулирование, анализ и визуализацию данных с помощью Python

Полезные ссылки:
1. "Поколение Python": курс для начинающих (однозначно лучший бесплатный курс на просторах русскоязычного интернета для новичка)
2.
"Поколение Python": курс для продвинутых (приступайте после прохождения предыдущего)
3.
Изучаем Python - Полный курс для начинающих (4-часовое видео на YouTube)
4.
Учебное пособие по Python
5.
Изучаем Python за 6 месяцев. Подробный план обучения (статья на habr.com)
6.
36 способов выучить Python бесплатно (для аналитиков и не только) (статья на vc.ru)
7.
Python Package Index - PyPI (хранилище программного обеспечения для языка программирования Python)

4. Power BI

Процесс обучения, нацеленный конкретно на практику, с нуля до продвинутого уровня в среднем может занять от 40 до 60 часов
Все инструменты, позволяющие визуализировать данные, интуитивно одинаковы, поэтому по моему мнению, не стоит растрачивать время на изучение всех, а сконцентрироваться на одном, например, Power BI. Даже если в компании, в которую вы трудоустроитесь, будет Tableau или Qlik, со знаниями Power BI, вам будет в принципе не сложно перенастроиться на другой аналогичный инструмент.

Power BI - это мощный инструмент бизнес-аналитики и визуализации данных, разработанный компанией Microsoft. Power BI может помочь вам легко анализировать, визуализировать и делиться данными с другими. Необходимые навыки для работы в Power BI:

  • Понимание основ анализа и визуализации данных. Перед изучением Power BI важно иметь прочную основу для анализа данных и концепций визуализации. Это включает в себя понимание различных типов данных, моделирование данных и создание эффективных визуализаций
  • Основы Power BI: основные функций Power BI (подключение к источникам данных, создание визуальных элементов и разработка отчетов и панелей мониторинга), создание простых гистограмм, линейных диаграмм и таблиц, а также фильтрацию данных
  • Понимание моделирования данных и создания пользовательских вычислений: функции моделирования данных в Power BI для создания связей между таблицами, определения иерархий и создания пользовательских вычислений с помощью DAX - создание более сложных и содержательных визуализаций
  • Передовые методы визуализации. Power BI предлагает широкий спектр визуализаций, включая настраиваемые визуальные элементы, детализированные диаграммы и карты для создания более интерактивных и привлекательных визуализаций
  • DAX: DAX - это язык формул, используемый в Power BI для определения пользовательских вычислений для моделирования, анализа и визуализации данных - создание сложных вычислений и мер, которые можно использовать в различных отчетах и информационных панелях
  • Практика работы с реальными данными. Для освоения Power BI, важно попрактиковаться с реальными данными

Полезные ссылки:
1. Живой курс по Power BI с нуля до устройства на работу (бесплатный курс на YouTube)
2.
Руководство по Power BI: начало работы (статья на habr.com)
3.
ТОП-9 Бесплатных Курсов в 2023 году (подборка 9 бесплатный курсов по Power BI)
4.
BI - ЭТО ПРОСТО (сайт с полезной информацией)
5.
14 Best Power BI Dashboard Examples 2023 (примеры дашбордов)
6.
Top 10 Best Power BI Dashboard Examples in 2023 (и еще примеры)

5. Статистика

Процесс обучения с нуля до получения сильной базы в среднем может занять от 60 до 80 часов

Как аналитик данных в 2023 году, вы должны изучить несколько важных статистических концепций и инструментов, чтобы эффективно анализировать и интерпретировать данные. Вот несколько ключевых областей, на которых следует сосредоточиться:

  • Байесовская статистика: основа для обновления убеждений или вероятностей на основе новой информации. Она все чаще используется в анализе данных, особенно в таких областях, как машинное обучение, принятие решений и прогнозное моделирование. Вы можете начать с изучения основных понятий байесовской статистики, таких как теорема Байеса и априорные и апостериорные распределения
  • Машинное обучение: ветвь искусственного интеллекта, которая использует статистические методы для построения прогностических моделей. Необходимо разбираться в различных типах алгоритмов машинного обучения, таких как обучение с учителем, обучение без учителя и обучение с подкреплением
  • Экспериментальный дизайн (A/B тестирование). Экспериментальный дизайн является ключевой областью статистики, которая включает в себя разработку и анализ экспериментов для проверки гипотез. Необходимо уметь планировать эксперименты, сводящие к минимуму предвзятость и максимизирующие статистическую мощность
  • Визуализация данных. Является важной частью анализа данных, которая включает создание визуальных представлений данных для обмена идеями и выводами. Как аналитик данных вы должны быть знакомы с различными типами диаграмм и графиков, такими как гистограммы, диаграммы рассеяния и тепловые карты
  • Аналитика больших данных. В связи с увеличением объема генерируемых данных важно знать, как работать с большими данными. Вам следует научиться использовать такие инструменты, как Hadoop и Spark, для обработки и анализа больших наборов данных. Вы также должны знать, как работать с базами данных NoSQL и распределенными вычислительными системами
  • В дополнение к этим областям для аналитиков данных также важно хорошо разбираться в теории вероятности, регрессионном анализе и статистическом выводе

Полезные ссылки (статьи на habr.com):
1. Введение в Байесовские методы
2.
Введение в машинное обучение
3.
Как устроен запуск экспериментов в ИТ-продукте
4.
Аналитика Big Data - реалии и перспективы в России и мире
5.
Теории вероятностей

Вот еще несколько полезных ссылок:
1. Дорожная карта аналитика данных 2023 года (статья)
2.
Stack Overflow (сообщество по программированию, где вас не оставят без ответа на вопрос)
3.
Microsoft Power BI Community (помощь в решении вопросов в Power BI)
4.
Аналитика и growth mind-set (телеграм канал по аналитике данных)
5.
Базы данных | Access, SQL, Big Data (телеграм канал по базам данных)

Полезные рекомендации

1. На самом старте обучения создайте резюме, разместите его на разных площадках по поиску работы - hh.ru, career.habr.com, LinkedIn.com (ничего страшного, если оно будет пустое) и по мере обучения обновляйте его

2. Ежедневно, в свободное время, мониторьте ситуацию ранке труда, смотрите какие вакансии появляются, какие у них требования, отмечайте для себя, добавляйте по мере изучения в свое резюме

3. Просматривайте резюме единомышленников, отмечайте для себя интересные моменты, читайте и смотрите рекомендации по составлению привлекательного резюме, ведь большая часть отсеивается в этапе просмотра резюме рекрутером

4. На досуге читайте литературу по изучаемой тематике - саморазвивайтесь

5. Вступайте и активно ведите деятельность в комьюнити сообществах, развивайте нетворкинг, ведь именно он и может поспособствовать вашему скорейшему трудоустройству

6. Ежедневно выделяйте время на обучение (1-2 часа в день = 30-60 часов в месяц)

Лично я не сторонник прямолинейного образования (продвижения от одного к другому), но тут уже кому как удобно. Мой процесс обучения был выстроен таким образом, что в самом начале я старался охватить как можно больше информации обо всех инструментах, понять как они взаимодействуют, что с их помощью создают, и когда уже было минимально необходимое понимание, я приступал к углубленному изучению конкретного инструмента, параллельно стараясь практиковать взаимосвязь с другими. Например, написать SQL запрос к учебной базе данных, выгрузить необходимую выборку данных в формате .XLSX, далее обработать с помощью Excel, импортировать в Python, построить быструю визуализацию, а с помощью Power BI создать красивый дашборд.

Благодарим, что дочитали нашу статью! Желаем успехов 😊

Друзья, поддержите наш труд обратной связью, вам этого ничего не стоит, а для нас это очень важно 😉