Решила я тут погрузиться в дата волт на практике. Нашла интересный проект — AutomateDV (бывший dbtvault) У них есть демо-проект, в котором создаются разные сущности, несколько видосов с объяснениями и небольшая, но очень детальная дока 💻 Поставила себе по инструкции dbt-core, dbt-postgres: python -m pip install dbt-core dbt-postgres Подключила AutomateDV — это просто пакет в dbt-проекте, задается в packages.yml: dbt deps Подняла постгрю в докере, настроила коннекшены, создала проект: dbt init Сгенерила данные из датасета TPC-H и положила их в volume: pip install tpchgen-cli mkdir data tpchgen-cli -s 1 -f csv -o ./data Создала таблицы и загрузила в них данные: COPY region FROM '/var/lib/postgresql/data/data/region.csv' DELIMITER ',' CSV HEADER; 🐾 Поначалу я смотрела видосы и делала все ручками. Потом забила и чисто запускала модельки, смотрела, что получается. Фреймворк автоматизирует создание дата волта. Во-первых, для стейджинга можно использовать такие поля: derived_co