276 читали · 1 год назад
SQL! Избавляемся от дубликатов эффективно
Введение При работе с базами данных, часто возникает необходимость устранить дубликаты из результатов SQL-запросов. Дубликаты могут оказать негативное влияние на анализ данных и привести к некорректным выводам. В этой статье мы рассмотрим, как можно эффективно удалить дубликаты с использованием оконных функций, предоставляя примеры и решения для таких ситуаций. DISTINCT Самым распространенным способом удаления дубликатов является использование оператора DISTINCT. Однако, это может быть очень тяжелой операцией для СУБД, особенно при больших объемах данных...
1468 читали · 3 года назад
6 SQL-запросов, о которых должен знать каждый дата-инженер
Источник: Nuances of Programming Знание продвинутого синтаксиса SQL необходимо и новичку, и опытному дата-инженеру или аналитику данных. В связи с бурным ростом объема данных все более важным становится умение очень быстро их анализировать. Объем данных на этом графике показан в зеттабайтах. 1 зеттабайт = 1 триллион гигабайтов Есть много очень вместительных нереляционных хранилищ, которые отлично выполняют свою работу, поддерживая массовое горизонтальное масштабирование с низкими затратами. Однако они не заменяют высококачественные хранилища на основе SQL, а лишь дополняют их...