341 читали · 1 год назад
SQL! Избавляемся от дубликатов эффективно
Введение При работе с базами данных, часто возникает необходимость устранить дубликаты из результатов SQL-запросов. Дубликаты могут оказать негативное влияние на анализ данных и привести к некорректным выводам. В этой статье мы рассмотрим, как можно эффективно удалить дубликаты с использованием оконных функций, предоставляя примеры и решения для таких ситуаций. DISTINCT Самым распространенным способом удаления дубликатов является использование оператора DISTINCT. Однако, это может быть очень тяжелой операцией для СУБД, особенно при больших объемах данных...
148 читали · 3 года назад
Linux — удалить дубликаты строк в файле
Напоминалка. Если нам нужно удалить из файла дубликаты строк, то нельзя использовать операторы перенаправления ">" или ">>". Такие операторы имеют более высокий приоритет и начинают писать в файл ещё до того, как полностью считали из него же все строки. Ну, как нельзя, можно, если использовать промежуточный файл, но это некрасиво. На помощь приходят инструменты: tee, sponge (из пакета moreutils), sed -i, awk и другие инструменты записи в файл. Сортировка и поиск дубликатов Давайте сначала разберём пару способов поиска дубликатов строк...