Если вам кажется, что приглашения на бесплатные вебинары по Python и реклама профессии data-scientist сыплется из каждого утюга, то вам не кажется. Спасибо карантину, рынок онлайн образования в этом году решительно заявил о себе. Я пересмотрела огромное количество бесплатных обучающих программ, чтобы вернуться в профессию и готова рассказать, на что стоит потратить свое время.
За годы без практики я не потеряла навыков работы в Excel на хорошем уровне, но начисто забыла, что такое SQL. К сожалению, большинство бесплатных образовательных программ эту тему игнорируют и кричат вам про необходимость знания Python (об этом мы поговорим отдельно). Что же делать? На самом деле, как бы грустно это не звучало, скорее всего, в вашей будущей работе вам потребуется очень маленький набор функций: нужно освоить функцию SELECT, разобраться со всеми видами соединений (JOIN) и запомнить пару простых слов для фильтрации и группировки (WHERE, GROUP BY). Если вы знаете английский язык, то запрос на SQL это фактически осмысленное предложение. На первых парах этого точно достаточно, никто не разрешит вам создавать таблицы или вставлять строки в существующую БД, поэтому не тратьте свое время на глубокий курс. Чтобы освоить пару нехитрых функций описанных выше, я могу рекомендовать следующее:
- Приложение SoloLearn. Мне нравится формат - короткая выжимка теории, затем небольшое упражнение, где вы как бы пишете запрос.
- Если устанавливать очередное приложение не хотите, то вот нормальный он-лайн учебник с примерами кода, смотрите sql-tutorial.ru и задания на sql-ex.ru.
- Я смотрела кусочек курса с Udemy, но курс этот не бесплатный, а пиратство я не поощряю. Умеющие гуглить справятся. Замечу лишь, что курс построен на учебной база Northwind. Как скачать можно почитать например здесь. Устанавливаете себе на компьютер и тренируете любые запросы. Я устанавливала PostgreSQL и тренировалась на нем, потом легко перешла на Microsoft SQL Server.
Теперь про многострадальный Python. Я начинала учить его еще пару лет назад, но бросила, потому что не понимала, а зачем он мне нужен. Когда в этом году я кинулась возвращать и повышать квалификацию, случилось тоже самое. Я смотрела обучающие курсы и не понимала, что мне делать с учением создать список и написать игру “угадай число”. Я пересмотрела кучу вебинаров и уже потеряла надежду, пока не увидела один, который наконец-то дал мне понимание, зачем аналитику нужен Python. Я посмотрела вебинар «Основы Python. Работа с библиотекой Pandas» от ProductStar. Это был лучший вебинар из примерно пятнадцати, которые я посмотрела за время карантина. Это видео нужно, чтобы получить общее представление и мотивацию. После этого я прошла бесплатный вводный курс “Основы Python и анализа данных” на Яндекс.Практикум. Я и это было именно то, что нужно. Этих знаний мне вполне хватает сейчас, хотя в дальнейшем я хочу плотнее поучиться работе с Pandas. Чем так хорош Яндекс.Практикум? В течении курса вы будете разбирать нормально сформулированную реальную задачу, а не записывать абстрактные буквы и цифры в переменные. Плюс у ребят после каждого урока есть короткая выжимка теории, которую можно скачать и пользоваться ей как конспектом. Это намного удобнее презентаций, который остаются после уроков на GeekBrains и в Нетологии (перелопатить 25 слайдов или посмотреть на одну страницу).
После Яндекса я прошла бесплатную часть курса от Karpov.Courses. Можно смотреть на YouTube, можно на платформе Stepik. Я рекомендую вторую опцию, потому что она дает возможность делать домашнее задание, а это в обучение самое главное. Этот курс понравился мне больше чем курс от Яндекса потому что он затрагивает больше тем. Из курса Яндекса мы узнаем методы группировки и сортировки данных в датафрейме и все, на этом конец бесплатной версии. Здесь же мы узнаем о применении этих методов в цепочке, об объединении датафреймов и даже немного о визуализации.
Ну что, поздравляю, теперь вы умеете находить и обрабатывать данные. Третий навык, который можно и нужно прокачивать это визуализация. Здесь есть два блока освоения: теоретический и практический. Теоретический: прочитайте какую-нибудь хорошую книгу или блог, который рассказывает про правила визуализации, как выбирать тип графиков и диаграмм, как сочетать цвета. Хорошая книга, которую я могу порекомендовать - “Графики, которые убеждают всех” от Александра Богачева. Есть еще хорошие карточки с разными типами визуализаций от datayoga. Про работу с цветом я планирую написать отдельную статью, поэтому на этом пункте подробно останавливаться не буду. Освоив теорию, можно перейти к практике. Теперь вы сможете правильно выбрать тип визуализации в Excel. Но если вдруг вы хотите поучиться работать с какой-то BI платформой, то посмотрите в сторону Microsoft Power BI или Tableau. По первому есть понятное обучение от самого Microsoft, да к тому же еще и переведенное на русский язык. Вот ссылка на портал с обучающими видео по разным продуктам Microsoft, вот здесь начальный блок по работе с Power BI. После этого можно уже будет погружаться во всякие тонкости работы с языком DAX, но это я пожалуй приберегу для следующей серии. Материалы по Tableau тоже можно найти в открытом доступе, например есть марафон от datayoga.
Итак, выше мы рассмотрели, бесплатные и, самое главное, качественные инструменты для первичного погружения в профессию. Попробуйте начать с них, прежде чем нести сбережения на платные курсы.