Есть мелочь, на которой пайплайн может споткнуться вообще в тупом месте. Недавно словил неприятную ошибку в трансформации. Логов было мало, по ним быстро не читалось, где именно всё поехало, а на вставке в следующий слой данные начали вести себя не так, как я ожидал. После нескольких проверок причина оказалась довольно приземлённой: часть колонок приехала не в тех типах, которые должны были быть на выходе. С тех пор я всё чаще явно привожу типы в ETL и заранее фиксирую схему. Особенно в местах, где дальше будет insert, union, промежуточная витрина или слой, от которого уже зависят следующие расчёты. В трансформациях легко привыкнуть писать просто: column И пока всё работает, кажется, что этого достаточно. Но если дальше колонка должна лечь в конкретный тип, лучше сразу привести её явно. Например, если на выходе нужна строка: CAST(column AS STRING) AS column Если колонка пока пустая, но дальше она должна существовать в схеме как DECIMAL(38,2), я тоже задаю тип сразу: CAST(NULL AS DECIMA