Приветствую вас, будущие айтишники!
Если вы читаете эту статью, то скорее всего, разделяете мою страсть к миру информационных технологий. Возможно, вас также привлекает высокий спрос на квалифицированных специалистов в данной отрасли, выгодные возможности трудоустройства, гибкость удаленной работы, возможность жить в любой точке мира и быть в курсе самых передовых технологических инноваций.
Если это так, то вы находитесь в правильном месте, потому что сегодня мы углубимся в тему того, как начать свое путешествие в мире IT в роли аналитика данных. Мы обсудим карьерные перспективы, траекторию обучения и подход к приобретению необходимых минимальных навыков и инструментов для старта. Предоставим минимум по 5 полезных ссылок на качественные бесплатные обучающие материалы по каждому рассматриваемому инструменту.
Кроме того, отдельно расскажем, сколько времени потребуется, чтобы освоить необходимый набор навыков, где учиться и как получить свой первый оффер с нуля.
Статья получилась большой, но очень интересной, особенно для начинающих аналитиков. Приступаем🔥
Прежде, чем приступить
Если вы решились начать свой путь в IT, то необходимо определиться с траекторией, по которой вы будете двигаться. И тут есть два варианта:
- Провести самотестирования на тему профессиональной ориентации - определиться с направлением вашей будущей деятельности и приобрести платный курс от одного из ведущих образовательных учреждений в сфере онлайн-образования, заплатить, на минуточку, в районе 200 000 рублей, но взамен получить четко структурированную программу обучения, опытных преподавателей и наставников на всем пути обучения, сертификаты, подтверждающие ваше владение тем или иным инструментом или навыком, доступ к центру карьерных консультаций, большое комьюнити единомышленников и на выходе диплом установленного образца, который может повысить вашу привлекательность для потенциального работодателя (хотя это не всегда гарантировано).
Если этот вариант вас вполне устраивает - замечательно, но тем не менее все же рекомендуем ознакомиться с содержанием данной статьи для собственного развития, так как зачастую, тех материалов, которые предоставляют онлайн-курсы бывает недостаточно 🤔
- Однако, если вы не готовы вкладывать значительные суммы денег в свое образование или просто не имеете средств, не отчаивайтесь, есть второй вариант. Мы живем в поистине замечательное время, когда доступ к Интернету делает нас всемогущими. Огромный океан полезной информации, доступной в Интернете, означает, что вам не обязательно тратить много денег, чтобы получать знания и навыки.
Самая мощная движущая сила успеха - это жгучее желание, подпитываемое мечтами. Поэтому, если вы действительно мечтаете стать аналитиком данных, действуйте, поскольку нет лучшего времени для начала, чем сейчас 😎
10 ключевых навыков аналитика данных
- Управление данными: сбор, организация, очистка и поддержка больших объемов данных
- Анализ данных: использование статистических методы, инструментов визуализации и других аналитических методов извлечения информации из данных
- Программирование: хорошее владение такими языками программирования, как Python, R, SQL и другими
- Критическое мышление: способность выявлять тенденции, закономерности и аномалии в данных и делать на их основе осмысленные выводы
- Коммуникация: сильные устные и письменные коммуникативные навыки важны для объяснения полученных данных как техническим, так и нетехническим заинтересованным сторонам
- Деловая хватка: понимание бизнеса и знание предметной области важно для представления результатов анализа данных в соответствующем контексте
- Креативность: способность подходить к проблемам творчески и непредвзято очень ценится при решении сложных проблем с данными
- Внимание к деталям: тщательная очистка и проверка данных необходима, чтобы избежать аналитических ошибок, которые могут привести к неверным результатам и выводам
- Непрерывное обучение: наука о данных и технологии являются быстро развивающимися областями, поэтому очень важно непрерывно обучаться и быть в курсе последних событий
- Сотрудничество: аналитики данных зачастую работают в командах, поэтому сильные навыки совместной работы очень важны
Дорожная карта аналитика данных в 2023 году
Важно отметить, что для изучения базовых инструментов в интернете доступно гораздо больше учебных материалов на английском языке. С целью приобщения вас к английскому языку, некоторые материалы мы будем предоставлять именно на английском, так как его знание необходимо для IT-специалиста. Если вам на первых этапах будет сложно, предлагаем использовать переводчик или субтитры к видео.
1. Excel
Процесс обучения, нацеленный конкретно на практику, с нуля до продвинутого уровня в среднем может занять от 20 до 40 часов
Кто бы что ни говорил, но даже в 2023 году Excel остается одним из важнейших инструментов в арсенале аналитика данных, который должен владеть им на продвинутом уровне, знать и уметь применять:
- Функции для очистки и подготовки данных: удаление дубликатов, заполнение пустых ячеек значениями и согласованное форматирование данных
- Инструменты визуализации данных: различные типы диаграмм и графики, а также функции условного форматирования, которые позволяют применять правила цвета и форматирования к данным на основе определенных условий
- Сводные таблицы: создание, редактирование и форматирование
- Статистический анализ: регрессия, корреляция и проверка гипотез
- Макросы: создание и использование в редакторе Visual Basic for Applications (VBA)
- Power Query: функции слияния и добавления таблиц, сведение и удаление данных, а также фильтрация и сортировка данных
- Power Pivot: функции создания связей между таблицами, использование формул DAX для расчетов и создания иерархий
Полезные ссылки:
1. Подборка бесплатных курсов по Excel на Stepik (выбирайте на вкус и цвет, потребуется регистрация)
2. Подробный список функций Excel по категориям
3. Learn Excel - бесплатное онлайн-обучение Excel (без регистрации и смс, как говорится)
4. Короткие видеоуроки Excel от Microsoft (не требует авторизации)
5. Бесплатные курсы и учебные руководства по теме «Excel» (требуется регистрация)
6. Полный курс по аналитике данных в Excel | Основные навыки для анализа данных в Excel | Упрощенное обучение (4-часовое видео на YouTube)
2. SQL
Процесс обучения, нацеленный конкретно на практику, с нуля до достаточного уровня в среднем может занять от 40 до 60 часов
SQL (Structured Query Language - язык структурированных запросов) - это язык программирования, используемый для управления данными и манипулирования ими в системах реляционных баз данных. Являясь аналитиком данных, хорошее понимание SQL необходимо для эффективного запроса и анализа данных.
Ключевые концепции и навыки, на которых следует сосредоточиться при изучении SQL в качестве аналитика данных:
- Синтаксис SQL: начните с изучения основного синтаксиса и структуры запросов SQL. Это включает в себя понимание предложений SELECT, FROM, WHERE и GROUP BY, которые используются для извлечения данных из базы данных
- Моделирование данных и проектирование баз данных. Понимание концепций моделирования данных и проектирования баз данных поможет вам эффективно создавать базы данных и управлять ими. Это включает в себя изучение нормализации данных, диаграмм сущность-связь и принципов проектирования баз данных
- Оптимизация запросов. Понимание того, как оптимизировать запросы для повышения производительности, имеет решающее значение для эффективного анализа данных
- Продвинутые концепции SQL. Как только вы освоите SQL на базовом уровне, вы сможете перейти к более сложным темам, таким как подзапросы, соединения, оконные функции и хранимые процедуры
- Практика: лучший способ выучить SQL - это практиковаться. Попробуйте решать задачи и работать над проектами, которые включают запросы к базам данных с использованием SQL
Полезные ссылки:
1. Интерактивный тренажер по SQL на Stepik (потребуется регистрация, но оно того явно стоит)
2. Учебник по SQL - полный курс по базам данных для начинающих (4-часовое видео на YouTube)
3. Учебное пособие по SQL
4. Памятка/шпаргалка по SQL
5. Введение в SQL и работу с базой данных от Нетологии (бесплатно, регистрируетесь, записываетесь на курс и проходите в удобное время)
6. Огромная подборка от коллеги по цеху (45 бесплатных курсов, тренажеров, тестов)
3. Python
Процесс обучения, нацеленный конкретно на практику, с нуля до необходимого уровня в среднем может занять от 160 до 200 часов
Перед тем, как приступить к изучению языков программирования, вам необходимо выбрать среду для разработки, установить и настроить ее (на ютуб вы найдете любые туториалы) для комфортной работы.
По моему субъективному мнению, на Python, для разработки лучше и удобнее всего использовать PyCharm, а для аналитики - Jupyter Notebook (удобен блочным выполнением кода).
Далее изучить концепцию системы управления версиями Git. Научиться пользоваться удаленным репозиторием, например я пользуюсь GitHub.
Python - популярный язык программирования, используемый аналитиками данных для обработки, анализа и визуализации данных. Ключевые концепции и навыки, на которых следует сосредоточиться при изучении Python для анализа данных в 2023 году:
- Основы Python: прочная база для углубления в аналитику - основы синтаксиса и концепций программирования (переменные, типы данных, поток управления, функции и модули)
- Обработка данных с помощью Pandas: Pandas - это библиотека Python для обработки и анализа данных. Используется для чтения, очистки, преобразования и управления данными. В нее входит работа с фреймами данных, группировка и агрегирование, слияние и объединение, а также работа с данными временных рядов
- Визуализация данных с помощью Matplotlib и Seaborn: Matplotlib и Seaborn - это библиотеки Python для визуализации данных. Используются для создания различных типов визуализаций, таких как гистограммы, линейные диаграммы, точечные диаграммы и тепловые карты, и передачи информации из данных
- Статистический анализ с помощью SciPy и StatsModels: SciPy и StatsModels - это библиотеки Python для научных вычислений и статистического анализа. Используются для выполнения статистических тестов, проверки гипотез и регрессионного анализа данных
- Машинное обучение с помощью Scikit-Learn: Scikit-Learn - это библиотека Python для машинного обучения. Используется для создания моделей контролируемого и неконтролируемого обучения, включая регрессию, классификацию, кластеризацию и уменьшение размерности
- Практика: лучший способ изучить Python для анализа данных - это практиковаться. Решайте задачи и работайте над проектами, которые включают в себя манипулирование, анализ и визуализацию данных с помощью Python
Полезные ссылки:
1. "Поколение Python": курс для начинающих (однозначно лучший бесплатный курс на просторах русскоязычного интернета для новичка)
2. "Поколение Python": курс для продвинутых (приступайте после прохождения предыдущего)
3. Изучаем Python - Полный курс для начинающих (4-часовое видео на YouTube)
4. Учебное пособие по Python
5. Изучаем Python за 6 месяцев. Подробный план обучения (статья на habr.com)
6. 36 способов выучить Python бесплатно (для аналитиков и не только) (статья на vc.ru)
7. Python Package Index - PyPI (хранилище программного обеспечения для языка программирования Python)
4. Power BI
Процесс обучения, нацеленный конкретно на практику, с нуля до продвинутого уровня в среднем может занять от 40 до 60 часов
Все инструменты, позволяющие визуализировать данные, интуитивно одинаковы, поэтому по моему мнению, не стоит растрачивать время на изучение всех, а сконцентрироваться на одном, например, Power BI. Даже если в компании, в которую вы трудоустроитесь, будет Tableau или Qlik, со знаниями Power BI, вам будет в принципе не сложно перенастроиться на другой аналогичный инструмент.
Power BI - это мощный инструмент бизнес-аналитики и визуализации данных, разработанный компанией Microsoft. Power BI может помочь вам легко анализировать, визуализировать и делиться данными с другими. Необходимые навыки для работы в Power BI:
- Понимание основ анализа и визуализации данных. Перед изучением Power BI важно иметь прочную основу для анализа данных и концепций визуализации. Это включает в себя понимание различных типов данных, моделирование данных и создание эффективных визуализаций
- Основы Power BI: основные функций Power BI (подключение к источникам данных, создание визуальных элементов и разработка отчетов и панелей мониторинга), создание простых гистограмм, линейных диаграмм и таблиц, а также фильтрацию данных
- Понимание моделирования данных и создания пользовательских вычислений: функции моделирования данных в Power BI для создания связей между таблицами, определения иерархий и создания пользовательских вычислений с помощью DAX - создание более сложных и содержательных визуализаций
- Передовые методы визуализации. Power BI предлагает широкий спектр визуализаций, включая настраиваемые визуальные элементы, детализированные диаграммы и карты для создания более интерактивных и привлекательных визуализаций
- DAX: DAX - это язык формул, используемый в Power BI для определения пользовательских вычислений для моделирования, анализа и визуализации данных - создание сложных вычислений и мер, которые можно использовать в различных отчетах и информационных панелях
- Практика работы с реальными данными. Для освоения Power BI, важно попрактиковаться с реальными данными
Полезные ссылки:
1. Живой курс по Power BI с нуля до устройства на работу (бесплатный курс на YouTube)
2. Руководство по Power BI: начало работы (статья на habr.com)
3. ТОП-9 Бесплатных Курсов в 2023 году (подборка 9 бесплатный курсов по Power BI)
4. BI - ЭТО ПРОСТО (сайт с полезной информацией)
5. 14 Best Power BI Dashboard Examples 2023 (примеры дашбордов)
6. Top 10 Best Power BI Dashboard Examples in 2023 (и еще примеры)
5. Статистика
Процесс обучения с нуля до получения сильной базы в среднем может занять от 60 до 80 часов
Как аналитик данных в 2023 году, вы должны изучить несколько важных статистических концепций и инструментов, чтобы эффективно анализировать и интерпретировать данные. Вот несколько ключевых областей, на которых следует сосредоточиться:
- Байесовская статистика: основа для обновления убеждений или вероятностей на основе новой информации. Она все чаще используется в анализе данных, особенно в таких областях, как машинное обучение, принятие решений и прогнозное моделирование. Вы можете начать с изучения основных понятий байесовской статистики, таких как теорема Байеса и априорные и апостериорные распределения
- Машинное обучение: ветвь искусственного интеллекта, которая использует статистические методы для построения прогностических моделей. Необходимо разбираться в различных типах алгоритмов машинного обучения, таких как обучение с учителем, обучение без учителя и обучение с подкреплением
- Экспериментальный дизайн (A/B тестирование). Экспериментальный дизайн является ключевой областью статистики, которая включает в себя разработку и анализ экспериментов для проверки гипотез. Необходимо уметь планировать эксперименты, сводящие к минимуму предвзятость и максимизирующие статистическую мощность
- Визуализация данных. Является важной частью анализа данных, которая включает создание визуальных представлений данных для обмена идеями и выводами. Как аналитик данных вы должны быть знакомы с различными типами диаграмм и графиков, такими как гистограммы, диаграммы рассеяния и тепловые карты
- Аналитика больших данных. В связи с увеличением объема генерируемых данных важно знать, как работать с большими данными. Вам следует научиться использовать такие инструменты, как Hadoop и Spark, для обработки и анализа больших наборов данных. Вы также должны знать, как работать с базами данных NoSQL и распределенными вычислительными системами
- В дополнение к этим областям для аналитиков данных также важно хорошо разбираться в теории вероятности, регрессионном анализе и статистическом выводе
Полезные ссылки (статьи на habr.com):
1. Введение в Байесовские методы
2. Введение в машинное обучение
3. Как устроен запуск экспериментов в ИТ-продукте
4. Аналитика Big Data - реалии и перспективы в России и мире
5. Теории вероятностей
Вот еще несколько полезных ссылок:
1. Дорожная карта аналитика данных 2023 года (статья)
2. Stack Overflow (сообщество по программированию, где вас не оставят без ответа на вопрос)
3. Microsoft Power BI Community (помощь в решении вопросов в Power BI)
4. Аналитика и growth mind-set (телеграм канал по аналитике данных)
5. Базы данных | Access, SQL, Big Data (телеграм канал по базам данных)
Полезные рекомендации
1. На самом старте обучения создайте резюме, разместите его на разных площадках по поиску работы - hh.ru, career.habr.com, LinkedIn.com (ничего страшного, если оно будет пустое) и по мере обучения обновляйте его
2. Ежедневно, в свободное время, мониторьте ситуацию ранке труда, смотрите какие вакансии появляются, какие у них требования, отмечайте для себя, добавляйте по мере изучения в свое резюме
3. Просматривайте резюме единомышленников, отмечайте для себя интересные моменты, читайте и смотрите рекомендации по составлению привлекательного резюме, ведь большая часть отсеивается в этапе просмотра резюме рекрутером
4. На досуге читайте литературу по изучаемой тематике - саморазвивайтесь
5. Вступайте и активно ведите деятельность в комьюнити сообществах, развивайте нетворкинг, ведь именно он и может поспособствовать вашему скорейшему трудоустройству
6. Ежедневно выделяйте время на обучение (1-2 часа в день = 30-60 часов в месяц)
Лично я не сторонник прямолинейного образования (продвижения от одного к другому), но тут уже кому как удобно. Мой процесс обучения был выстроен таким образом, что в самом начале я старался охватить как можно больше информации обо всех инструментах, понять как они взаимодействуют, что с их помощью создают, и когда уже было минимально необходимое понимание, я приступал к углубленному изучению конкретного инструмента, параллельно стараясь практиковать взаимосвязь с другими. Например, написать SQL запрос к учебной базе данных, выгрузить необходимую выборку данных в формате .XLSX, далее обработать с помощью Excel, импортировать в Python, построить быструю визуализацию, а с помощью Power BI создать красивый дашборд.
Благодарим, что дочитали нашу статью! Желаем успехов 😊
Друзья, поддержите наш труд обратной связью, вам этого ничего не стоит, а для нас это очень важно 😉