2 подписчика
Введение При работе с базами данных, часто возникает необходимость устранить дубликаты из результатов SQL-запросов. Дубликаты могут оказать негативное влияние на анализ данных и привести к некорректным выводам. В этой статье мы рассмотрим, как можно эффективно удалить дубликаты с использованием оконных функций, предоставляя примеры и решения для таких ситуаций. DISTINCT Самым распространенным способом удаления дубликатов является использование оператора DISTINCT. Однако, это может быть очень тяжелой операцией для СУБД, особенно при больших объемах данных...
6 месяцев назад
83 подписчика
Этот материал посвящён тем, кто: Уже работает с SQL, но не до конца его понимает Неплохо знает SQL, но никогда особо не задумывался над его структурой Хочет обучать SQL других В этом руководстве мы сосредоточимся на операторах SELECT 1. SQL является декларативным SELECT first_name, last_name FROM employees WHERE salary > 100000 Все понятно. И вас не волнует, откуда эти записи о сотруднике (employee) берутся. Вам лишь нужны те, у которых достойная зарплата (salary). Если все так просто, в чем же...
2 года назад
9,3K подписчиков
👆🏻Тонкости дедубликации с DISTINCT Исключить дубли из выборки можно просто добавив к SQL-запросу ключевое слово DISTINCT. Однако, это простое решение не всегда будет верным. Чтобы гарантировать отсутствие дубликатов в наборе данных, СУБД необходимо сравнить все строки друг с другом, отсеяв повторы. Это требует много ресурсов ЦП и памяти для хранения всех строк, т.к. их нужно сравнивать друг с другом в памяти, даже если на низком уровне идет работа с хэшем. Кроме того, DISTINCT уменьшает параллелизм вычислений, снижая скорость выполнения запроса...
2 года назад