176 подписчиков
Моделирование данных в хранилище
☝️ Была мысль написать сразу про моделирование хранилищ данных - есть запрос на минимальное описание подхода Data Vault.
Но если подумать, нельзя начать с Vault, и при этом не вспомнить про схемы Star (Звезду) или Snowflake (Снежинку).
Основоположниками вообще всей истории с хранилищами и тем как правильно раскладывать в них данные считают двух мужей: Билл Инмон (Bill Inmon) и Ральф Кимбалл (Ralph Kimball)
Произведения, по которым учатся до сих пор, поищите в интернете, если интересно:
Inmon, William H., Building the Data Warehouse, 1992
Kimball, Ralph, The Data Warehouse Toolkit, 1996
Ну так вот, есть мысль рассказать про моделирование в хранилищах. Но тут возникла маАаленька проблемка: как только мы начинаем разговор о хранилищах и базах данных, то сразу сталкиваемся с такими понятиями как нормализация, реляционность, измерения, факты.
Ну и, конечно, OLTP и OLAP - разницу между этими двумя подходами/системами обработки данных тоже надо понимать.
Когда спрашиваешь своих коллег - глубоко погруженных в проектирование баз данных и построение хранилищ - что это такое, для чего это и в чём смысл? То, конечно, все с удовольствием объясняют, но понятнее не становится. Можно изучать самостоятельно по ссылкам в вики, читать тематические статьи и книги. Лично мне не сильно помогло в моё "зелёное время", так как "опыт - сын ошибок трудных" - это наше всё.
Но я попробую рассказать Вам об этом всём как можно проще. Начну давать определения и понемножку объяснять все эти дикие понятия по-простецки, так, чтобы стало понятно даже тем, кто далёк от ИТ-сферы.
Для особенно торопящихся ниже даны ссылки на вики - там на буржуйском языке можно почитать обо всём, что упоминалось выше, уже сейчас.
Подход звезда: https://en.wikipedia.org/wiki/Star_schema
Подход снежинка: https://en.wikipedia.org/wiki/Snowflake_schema
Нормализация: https://en.wikipedia.org/wiki/Database_normalization
Реляционная база данных: https://en.wikipedia.org/wiki/Relational_database
P.S.: Ой, ой, наверное, тяжелятина в канале начнётся - не разбегайтесь, крепитесь! 🥰
1 минута
13 октября 2024