Найти в Дзене
Закреплено автором
Покупайте СтеллыИ дарите их за контент
1 час назад

🔹 Snowflake-архитектура: понятно для junior

🔹 Зачем Snowflake разделяет хранение и вычисления — и что такое multi-cluster, elasticity, RAID в этом контексте? 🔸 Разделение storage и compute решает проблему блокировок и плохой масштабируемости: в классическом хранилище одно тяжёлое задание может «пожрать» ресурсы и тормозить BI‑запросы. Snowflake хранит данные отдельно, поэтому вычислительные мощности можно добавлять независимо. 🔸 Storage в Snowflake — это облачное хранилище с избыточностью (как RAID — Redundant Array of Independent Disks): данные реплицируются и не зависят от конкретных виртуальных машин...

1 день назад

🔹 Schema: что это в базе данных

? 🔹 Хочешь понять, почему структуры таблиц влияют на всё приложение? 🔸 Без схемы данные становятся «без правил»: разный формат, дубли, сложности при объединении таблиц и баги в приложении. Схема решает эту хаотичность и даёт гарантию структуры. 🔸 Schema — это описание набора таблиц, их атрибутов (столбцов), типов и ограничений. В реляционной модели каждую таблицу можно считать отношением: строки — кортежи, столбцы — атрибуты. 🔸...

2 дня назад

🔹 Zero-shot vs Few-shot: давать пример или нет

? 🔹 Когда вставлять demonstrations (пример) в промпт, а когда оставить zero-shot? 🔸 С проблемой: без примера модель может интерпретировать задачу по‑своему — ответы станут непоследовательными или не в нужном формате. Demonstrations помогают задать ожидание и снять неоднозначность. 🔸 zero-shot — подходит, когда задача простая, формат гибкий или нужен неожиданный творческий результат. Если хочешь посмотреть, как модель сама решит проблему, не давай примеров. 🔸 few-shot — нужен, когда важен...

3 дня назад

🔹 Транзакция в БД: ACID простыми словами

🔹 Зачем нужны транзакции? 🔸 Транзакция решает проблему неконсистентного состояния при множественных связанных операциях: либо все изменения применяются, либо никакие. ACID (Atomicity, Consistency, Isolation, Durability). 🔸 Atomicity (атомарность) — группы операций выполняются как единое целое; если одна падает, всё откатывается, чтобы не осталось полумеры. 🔸 Consistency (согласованность) — после транзакции данные соответствуют правилам (ограничениям, триггерам). Транзакция предотвращает нарушение бизнес-правил...

4 дня назад

🔹 Data Pipeline: от source до витрины

🔹Как данные из source попадают в витрину и зачем нужен pipeline? 🔸Pipeline нужен, чтобы автоматически и надёжно перемещать данные: без него — ручные копирования, рассинхронизация и ошибки. Pipeline решает проблему повторяемости и контроля качества данных. 🔸Типичный путь: source (система, лог или API) → стейджинг (raw зона для сырых данных) → трансформации → витрина (анализная таблица). ETL (Extract, Transform, Load) — извлечение, преобразование, загрузка — описывает эти шаги. 🔸Практический...

Покупайте СтеллыИ дарите их за контент