Любая аналитика ломается на одном принципе: Garbage in — garbage out (мусор на входе → мусор на выходе). Поэтому DWH и BI всегда упираются в качество данных и мастер‑данные. Термины:
Data Quality (качество данных) — правила, которые проверяют данные на ошибки и аномалии. MDM (Master Data Management) — управление мастер‑данными: единые справочники (SKU, клиенты, точки).
Дедупликация — поиск и объединение дублей (одна точка записана 3 способами).
Мэппинг — сопоставление локальных кодов (дистрибьютора) с глобальными (производителя).
Сходимость — когда одно и то же число сходится в разных отчётах при одинаковых правилах. 1) Один SKU в разных системах имеет разные коды/названия.
2) Дубли торговых точек: отчёты завышают охват и искажают продажи.
3) Смешаны периоды: у одного “неделя”, у другого “период 7 дней со сдвигом”.
4) Возвраты и корректировки приходят позже и меняют историю.
5) Нереальные значения: продажи отрицательные, остатки “в минус”, скачки x10 без причины.
6) Нет свя