Изучать теорию в любом деле - это хорошо. Но без практики это может оказаться тупиковым путем.
От автора Telegram-канала Аналитика и Growth mind-set (делюсь кейсами с работы, бесплатным обучением, задачами с собеседований).
Изучать теорию в любом деле — это хорошо. Но без практики это может оказаться тупиковым путем.
Я сейчас завершаю читать книгу «Суперобучение», так в ней автор вообще рекомендует все обучение начинать сразу с практики.
Поэтому далее делюсь 3 примерами проектов для начинающих аналитиков данных, на которых можно попрактиковаться и которые можно положить в портфолио. В статье приведены кусочки из проектов, если хотите прочитать подробнее, смотрите по ссылкам, которые указаны в каждом примере.
Проект очистки данных и исследовательского анализа популярных видео на YouTube
В этой статье рассказывается, как аналитик данных Раахим Хан очищал набор ежедневно обновляемой статистики популярных видео на YouTube.
Инструмент, используемый в этом проекте, — это Python (библиотеки Numpy и Pandas, а для визуализации и исследования данных — Matplotlib и Seaborn и другие).
Сам проект с выводами и кодом можно почитать на Medium. Дата сет, который использует в проекте, на Kaggle.
Раахим сначала очищает данные (исправляет типы данных, проверяет отсутствующие значения, объединяет датафреймы в один фрейм данных и тд).
Один из примеров:
Если тема для вас интересна, то дочитать статью можно у нас на сайте: https://spark.ru/user/147256/blog/105551/3-podrobnih-primera-proektov-dlya-nachinayuschih-analitikov-dannih