Добавить в корзинуПозвонить
Найти в Дзене

Цикл аналитики данных

Цикл аналитики данных Недавно делился книгой по Analytics engineering, там расписан цикл аналитики данных: 🔹 Определение проблемы 🔹 Моделирование данных 🔹 Извлечение данных и трансформация 🔹 Хранение и структуризация 🔹 Визуализация и анализ 🔹 Мониторинг качества данных, создание документации В целом согласен с таким циклом, действительно работа с данными от начала и до конца включает все эти шаги. Единственное что хочется добавить, что данный цикл описывает техническую работу с данными, но не отражает большую часть работы аналитика: - сбором требований и общение с заказчиками (можно отнести к 1-му пункту) - создание или выбор методологии расчета метрик (что учитывать в зависимости от доступных данных, бизнес-кейсов и самой поставленной задачи) - проверка качества данных ДО анализа (оценка можно ли вообще рассчитать то что нужно на основе доступных данных или нет) Также дополню, что аналитик может быть сфокусирован на одном или нескольких этапах данного цикла. Например, опред

Цикл аналитики данных

Недавно делился книгой по Analytics engineering, там расписан цикл аналитики данных:

🔹 Определение проблемы

🔹 Моделирование данных

🔹 Извлечение данных и трансформация

🔹 Хранение и структуризация

🔹 Визуализация и анализ

🔹 Мониторинг качества данных, создание документации

В целом согласен с таким циклом, действительно работа с данными от начала и до конца включает все эти шаги.

Единственное что хочется добавить, что данный цикл описывает техническую работу с данными, но не отражает большую часть работы аналитика:

- сбором требований и общение с заказчиками (можно отнести к 1-му пункту)

- создание или выбор методологии расчета метрик (что учитывать в зависимости от доступных данных, бизнес-кейсов и самой поставленной задачи)

- проверка качества данных ДО анализа (оценка можно ли вообще рассчитать то что нужно на основе доступных данных или нет)

Также дополню, что аналитик может быть сфокусирован на одном или нескольких этапах данного цикла. Например, определение проблемы и визуализация. Или оценка качества и расчет метрик, если данные например уже известно где лежат, задача поставлена и визуализация не требуется.

Лично я люблю комплексные задачи, состоящие из нескольких этапов цикла, так можно переключаться между аналитическими и инженерными задачами, при этом также появляется и гибкость решений 😉