2 подписчика
Введение При работе с базами данных, часто возникает необходимость устранить дубликаты из результатов SQL-запросов. Дубликаты могут оказать негативное влияние на анализ данных и привести к некорректным выводам. В этой статье мы рассмотрим, как можно эффективно удалить дубликаты с использованием оконных функций, предоставляя примеры и решения для таких ситуаций. DISTINCT Самым распространенным способом удаления дубликатов является использование оператора DISTINCT. Однако, это может быть очень тяжелой операцией для СУБД, особенно при больших объемах данных...
83 подписчика
Этот материал посвящён тем, кто: Уже работает с SQL, но не до конца его понимает Неплохо знает SQL, но никогда особо не задумывался над его структурой Хочет обучать SQL других В этом руководстве мы сосредоточимся на операторах SELECT 1. SQL является декларативным SELECT first_name, last_name
FROM employees
WHERE salary > 100000 Все понятно. И вас не волнует, откуда эти записи о сотруднике (employee) берутся. Вам лишь нужны те, у которых достойная зарплата (salary). Если все так просто, в чем же...
9,3K подписчиков
👆🏻Тонкости дедубликации с DISTINCT Исключить дубли из выборки можно просто добавив к SQL-запросу ключевое слово DISTINCT. Однако, это простое решение не всегда будет верным. Чтобы гарантировать отсутствие дубликатов в наборе данных, СУБД необходимо сравнить все строки друг с другом, отсеяв повторы. Это требует много ресурсов ЦП и памяти для хранения всех строк, т.к. их нужно сравнивать друг с другом в памяти, даже если на низком уровне идет работа с хэшем. Кроме того, DISTINCT уменьшает параллелизм вычислений, снижая скорость выполнения запроса...