Самая дорогая часть аналитики — не дашборд. Самая дорогая часть — интеграции и трансформации данных. Там рождаются «почему не сходится» и «давайте ещё один файл». Термины на 1 минуту: На практике чаще всего работает гибрид: грузим «сырые» данные в слой Raw, затем строим “правильные” витрины. 1) Каждый источник — отдельный контракт данных.
Что, когда, в каком формате, что считается ошибкой.
2) Идентификаторы важнее названий.
Нужны стабильные ключи: SKU_ID, Client_ID, Distributor_ID.
3) Справочники — не “потом”.
Без единого каталога SKU и контрагентов KPI не будут сходиться.
4) Версионируйте правила.
Если поменяли расчёт KPI — фиксируйте дату и версию.
5) Загрузка без логов — это лотерея.
Должно быть видно, что пришло, что пропало, что “подозрительно”.
6) Один календарь периодов.
Неделя/месяц/закрытый период должны быть одинаковы для всех отчётов.
7) Контроль качества по правилам.
Отрицательные продажи, остатки “в минус”, дубли точек, неожиданные скачки. Хороши