Всем привет! Я — практикующий исследователь данных, и на этом канале делюсь тем, что реально работает в IT. Никакой сухой теории, только личный опыт, рабочие инструменты и грабли, на которые я уже наступил за вас. Рад, что вы здесь!
Множество статей на тему бесплатных ресурсов для аналитики данных я в своё время прошерстил, но редко — а может, и никогда — натыкался на примеры, где автор делится своим опытом изучения, а не просто перечисляет сайты. Поэтому я решил написать про то, что реально помогло мне, и, надеюсь, это вдохновит тебя тоже.
Stepik.org
Степик для меня всегда будет на первом месте. В нём есть душа, и каждый, кто создаёт там бесплатный курс (да даже платный), вкладывает в него частичку себя. Я встречал в курсах и юмор, и работу со страхами, и лайфхаки — это не просто сухие лекции.
Не буду рекламировать конкретные курсы, но вот направления, где точно есть бесплатные материалы:
- Курсы по Python — как минимум два сборника гениальных курсов с кучей наград. Найти их легко через поиск. Есть и платные, с углублёнными темами вроде ООП или структур данных, но бесплатные курсы в Степике не уступают по качеству. Я знаю, о чём говорю — я пользователь и бесплатных, и платных, и в свободное время постоянно там что-то изучаю или практикую, чтобы не терять форму.
- Аналитика и инструменты — ищите не только "Аналитика данных", но и ключевые слова вроде "Визуализация", "Дашборды", "Pandas", "Numpy", "Scipy", "ML". Бесплатных курсов хватает.
- SQL — много курсов для изучения и практики, плюс есть бесплатный тренажёр SQL.
Kaggle
Без него никуда, особенно если хочешь тренироваться в анализе данных, а работу ещё не нашёл. Я там постоянно беру датасеты, модели и готовые Jupyter Notebook-и с решёнными задачами, чтобы быстро прогнать свои данные и проверить гипотезы. Есть соревнования и для новичков, и для профи — подойдёт как для обучения, так и для практики.
Для меня Kaggle — такое же чудо, как GitHub или Stack Overflow. Кстати, на GitHub тоже куча информации и готовых кейсов по аналитике данных на все случаи жизни. Я там храню свои шпаргалки по инструментам, справочники и даже словари (по английскому и названиям объектов в Python).
Каналы в Telegram
В своё время я окружил себя информационным пространством в сфере аналитики данных: убрал новостные каналы в ТГ и заменил их тренажёрами по Python, каналами про аналитику, новости из мира Data Science. Это сыграло свою роль — до сих пор иногда заглядываю туда и нахожу что-то новое (тренды, книги, новости) или просто вдохновляюсь.
Хабр
Когда мне что-то непонятно по теме или инструменту, я вбиваю вопрос в поиск, и "хочешь не хочешь" попадаю на статьи в Хабре. Со временем я начал искать ответы там напрямую. Могу с уверенностью сказать: это место, где IT-темы объясняют люди, прошедшие тот же путь, что и ты. Поэтому понятнее, чем на курсах, какими бы крутыми они ни были.
Документация
Во время обучения Python я часто гуглил методы и функции, если что-то было непонятно. И всегда между официальной документацией и форумами/статьями выбирал второе — пару раз зашёл в документацию, не разобрался и выбежал оттуда.
Не знаю, как я к этому пришёл, но теперь в 90% случаев лезу в документацию. Там нахожу не только ответы, но и понимаю, как функция работает на низком уровне, какие ошибки бывают и как их обойти. Желаю всем как можно раньше подружиться с документацией библиотек, которыми пользуетесь. В моём случае это Pandas и Numpy — теперь я без них как без рук.
Книги
Об этом говорят на каждом курсе и каждый "обучальщик" 💁🏽… Но что поделать, если без них реально тяжелее. У меня мало времени на книги, но если читаю, то в 90% случаев это техническая или научная литература, по 15–20 минут за раз.
Когда я только пришёл в аналитику, у меня были сложности со статистикой и теорией вероятностей — в универе это было 15 лет назад. На курсах эти темы дают с лихвой, но быстро забываются. А фундамент лучше закладывать через книги, примеры и разбор задач.
По счастливой случайности, когда я начал учить Python, я был подписан на IT-группу в Telegram — XOR. Не знал, что участвую в розыгрыше, но выиграл 6 книг по Data Science. Одна из них — "Голая статистика" Чарльза Уиллана. Читал её по 15–20 минут в день, около месяца. Не буду кричать, какая она крутая, — просто скажу, что вспомнил забытое, узнал новое, и теперь каждый день применяю именно эти знания. Скажу больше, буквально спустя пару месяцев после прочтения этой книги, на собеседовании мне задали несколько вопросов на которые я с легкостью и с полна ответил благодаря ей.
Выводы
Все эти ресурсы — не просто список, а то, что реально помогло мне войти в аналитику данных и не потеряться. Степик дал базу и практику, Kaggle — возможность сразу применять знания, Сообщества в Telegram и Хабр — вдохновение и ответы на вопросы, документация — глубину, а книги — фундамент.
Если ты только начинаешь, не бойся пробовать всё подряд: бери датасет, гугли, читай, учись на своих ошибках. Главное — не стоять на месте. Я до сих пор учусь и практикуюсь, потому что аналитика — это не пункт назначения, а дорога.
Я не претендую на последнюю инстанцию, я пишу о своём пути и опыте. Спасибо что дочитали до конца. Подпишитесь👇👇👇, ставьте лайки 👍🏽👍🏽👍🏽 впереди много интересных статей про навыки, инструменты, обучение, лайфхаки и пути аналитика.