Найти в Дзене

Навыки Аналитика DWH


Привет!
В двух прошлых постах писал про основные направления задач Аналитика DWH на проектах.

Давайте здесь суммируем необходимые навыки для выполнения этих задач:

1️⃣ SQL
Язык, на котором пишутся запросы к данным в базах и хранилищах. Что из операторов и нужно знать
- DDL команды на создание/редактирование таблиц и их свойств
- SELECT запросы и все что в них включается ⤵️
- операторы фильтрации WHERE, HAVING после агрегации
- сами функции агрегации и оператор GROUP BY
- JOIN для объединения таблиц
- функции работы со строками, датой и временем
- логические и арифметические операторы
- Подзапросы и табличные выражения
- Оконные функции
- Индексы и оптимизация запросов

+ Составление моделей данных и ER-диаграмм

2️⃣ Подходы к построению хранилищ данных
- Сюда можно включить знание основополагающих подходов к построению хранилищ от (Кимбалл, Инмон)
- Понимание чем отличаются DWH от Data Lake, что такое объектное хранилище и какие есть гибриды (например, Lake House)
- Другие модели построения хранилищ (Data Vault, Anchor Modelling)
- Понимание моделей звезда ⭐️ и снежинка ❄️, чем отличаются таблицы фактов от таблиц измерений
- Понимание различий между OLTP и OLAP системами
- Понимание почему в хранилищах обычно несколько различных слоев хранения данных

3️⃣ Навык составления документации и сбор требований
- Тут вообще важно сначала понимать роль аналитика на проекте, почему важно общаться и коммуницировать с бизнес-заказчиками и что IT - это цифровой помощник бизнеса.
- Сбор требований (бизнес, пользовательские, функциональные, нефункциональные)
вот в этих постах (пост 1, пост 2) есть много материалов про требования, да и просто по поиску в канале можете много чего найти по этой теме
- составление словарей данных, source to target (S2T) документов

Это основные навыки (ну либо скорее темы и направления для прокачки навыков), которые нужны аналитикам DWH.
Кроме этого сюда можно добавить ETL/ELT инструменты, знание Python будет хорошим плюсом, а также из этого вытекают знания по возможным способам интеграции и передачи данных между системами, ну и конечно никто никогда не отменяет soft-навыков 😉

Приобрести эти навыки на курсе ➡️ "Основы анализа данных"
1 минута
134 читали