🔹 Что выбрать для конкретной задачи — реляция, гибкость или единое хранилище? 🔸 NoSQL vs SQL появились потому что разные данные требуют разных компромиссов: SQL (Structured Query Language) даёт строгую схему и сильную согласованность, NoSQL (Not Only SQL) — гибкость и горизонтальную масштабируемость. Без правильного выбора данные быстро станут тяжёлыми для изменений и аналитики. 🔸 Data Lakehouse решает проблему дублирования и разрыва между сырыми данными и аналитикой: объединяет Data Lake и хранилище, чтобы хранить сырьё и одновременно давать структуру для BI. 🔸 pandas read_csv загружает CSV в DataFrame; после чтения делайте data filtering (boolean-маски, .query) чтобы уменьшить объём перед загрузкой в хранилище или отправкой в ML. 🔸 Практика: возьмите реальный CSV, загрузите через pandas read_csv, отфильтруйте и сохраните результаты в SQL и в NoSQL/лаке — сравните сложность запросов и производительность. 📚 Сделайте небольшое сравнение — это развивает архитектурное чутьё. #