sfd
6 SQL-запросов, о которых должен знать каждый дата-инженер
Источник: Nuances of Programming Знание продвинутого синтаксиса SQL необходимо и новичку, и опытному дата-инженеру или аналитику данных. В связи с бурным ростом объема данных все более важным становится умение очень быстро их анализировать. Объем данных на этом графике показан в зеттабайтах. 1 зеттабайт = 1 триллион гигабайтов Есть много очень вместительных нереляционных хранилищ, которые отлично выполняют свою работу, поддерживая массовое горизонтальное масштабирование с низкими затратами. Однако они не заменяют высококачественные хранилища на основе SQL, а лишь дополняют их...
ClickHouse: оконные функции с нуля
Источник: Nuances of Programming Курс SkillFactory Python для анализа данных. Вы научитесь за минуты обрабатывать большие файлы и создавать отчеты, автоматизируете сбор данных из интернета, освоите парсинг и работу с API. Оконные функции в ClickHouse ClickHouse — легко масштабируемая столбцовая, реляционная СУБД, оптимизированная под аналитические рабочие нагрузки. Это продукт с открытым исходным кодом, разработанный в «Яндексе». Одна из ключевых особенностей ClickHouse — поддержка продвинутых аналитических функций, в том числе оконных...