901 подписчик

Как найти, выделить и удалить дубликаты в Google Sheets

Дублирование данных — бич электронных таблиц, особенно в масштабе. Учитывая объем и разнообразие данных, которые сейчас вводятся командами, дублирование данных в таких инструментах, как Google Sheets, может быть актуальным и необходимым, а может отвлекать от основной цели работы с электронными таблицами. Потенциальная проблема порождает хороший вопрос: Как выделить дубликаты в Google Sheets? Я подготовил для вас пошаговую инструкцию по выделению дубликатов в Google Sheets и поиску дубликатов в Google Sheets с изображениями, чтобы убедиться, что вы на правильном пути, когда дело доходит до удаления дубликатов данных.

Как найти дубликаты в Google Sheets

Google Sheets — это бесплатная облачная альтернатива собственным программам для работы с электронными таблицами, которая — что неудивительно, ведь мы имеем дело с Google — предлагает множество отличных функций для упрощения ввода данных, форматирования и расчетов. Существует два способа удаления дубликатов в Google Sheets: условное форматирование и функция UNIQUE. Ниже я расскажу об обоих способах, но прежде чем вы начнете следовать им, я хочу отметить две вещи:

  1. Вы можете запускать несколько правил условного форматирования одновременно, поэтому вам не нужно удалять ни одно из них, чтобы запустить правило условного форматирования для удаления дубликатов.
  2. Если в данных есть лишние символы или пробелы, то точного подсчета дубликатов не получится, поэтому необходимо убедиться, что набор чист. Даже случайный лишний пробел будет считаться отдельной точкой данных.

Давайте рассмотрим, как можно выделять и удалять дубликаты в Google Sheets.

Выделение дубликатов данных в Google Sheets

В Google Sheets есть все привычные функции: Файл, Редактирование, Вид, Формат, Данные, Инструменты и т. д., и позволяет быстро вводить данные, добавлять формулы для расчетов и обнаруживать ключевые взаимосвязи. В то время как другие инструменты для работы с электронными таблицами, такие как Excel, имеют встроенные средства условного форматирования для выявления дубликатов данных в листе, решение Google требует немного больше ручных усилий.

Дублирование данных — бич электронных таблиц, особенно в масштабе.

Как же автоматически выделить дубликаты в Google Sheets? Хотя встроенного инструмента для этого не существует, вы можете использовать некоторые встроенные функции для выделения дубликатов данных.

Шаг за шагом: как выделить дубликаты в Google Sheets (с картинками)

Вот пошаговое руководство по выделению дубликатов в Google Sheets:

Шаг 1: Откройте свою электронную таблицу.

Шаг 2: Выделите данные, которые вы хотите проверить.

Шаг 3: В разделе «Формат» выберите «Условное форматирование».

Шаг 4: Выберите «Пользовательская формула есть».

Шаг 5: Введите пользовательскую формулу проверки дубликатов.

Шаг 6: Нажмите «Готово», чтобы увидеть результаты.

Шаг 1: Откройте свою электронную таблицу.

Сначала перейдите в Google Таблицы и откройте таблицу, которую нужно проверить на наличие дубликатов данных.

Дублирование данных — бич электронных таблиц, особенно в масштабе.-2

Шаг 2: Выделите данные, которые вы хотите проверить.

Затем проведите курсором по данным, которые нужно проверить, чтобы выделить их.

Дублирование данных — бич электронных таблиц, особенно в масштабе.-3

Шаг 3: В разделе «Формат» выберите «Условное форматирование».

Теперь перейдите к пункту «Формат» в верхней строке меню и выберите «Условное форматирование». У вас должно появиться всплывающее окно с заголовком «Правила условного форматирования».

Дублирование данных — бич электронных таблиц, особенно в масштабе.-4

Шаг 4: Выберите «Пользовательская формула есть».

Далее необходимо создать пользовательскую формулу. Щелкните стрелку вниз под пунктом «Форматировать ячейки, если» и выберите в выпадающем меню пункт «Пользовательская формула». Это последний вариант, поэтому прокрутите его до конца.

Дублирование данных — бич электронных таблиц, особенно в масштабе.-5

Шаг 5: Введите пользовательскую формулу проверки дубликатов.

Для поиска дубликатов данных нам нужно ввести пользовательскую формулу проверки дубликатов, которая для нашего столбца данных (A) выглядит следующим образом:

=COUNTIF(A:A,A1)>1

Формула ищет любую текстовую строку, которая встречается в наборе данных более одного раза. Цвет выделения по умолчанию — зеленый, но его можно изменить, нажав на значок баллончика с краской в меню «Стиль форматирования».

Дублирование данных — бич электронных таблиц, особенно в масштабе.-6

Шаг 6: Нажмите «Готово», чтобы увидеть результаты.

И вуаля — мы выделили дубликаты данных в Google Sheets.

Дублирование данных — бич электронных таблиц, особенно в масштабе.-7

Как выделить дубликаты в нескольких строках и столбцах

Вы также можете выделить дубликаты в нескольких строках и столбцах, если у вас большой набор данных. Процесс начинается так же, как и выше, но в меню «Правила условного формата» вы вводите расширенный диапазон данных, чтобы учесть все ячейки, которые вы хотите сравнить. В качестве отправной точки я использую тот же пример, что и выше, но добавлю еще несколько имен, поэтому мы используем формулу для поиска по трем столбцам: A, B и C, а также по строкам 1-10.

Дублирование данных — бич электронных таблиц, особенно в масштабе.-8

Для начала повторите шаги 2 — 4, описанные выше, но на шаге 5 введите следующее уравнение:

=COUNTIF($A$2:G,Indirect(Address(Row(),Column(),)))>1

Это позволит выделить все дубликаты во всех трех столбцах и всех десяти строках, что облегчит поиск двойников данных:

Дублирование данных — бич электронных таблиц, особенно в масштабе.-9

Поиск и выделение дубликатов в Google Sheets с помощью функции Unique

Еще один способ найти дубликаты в Sheets — использовать функцию UNIQUE, которая ищет уникальные значения в заданном диапазоне и выдает список без дубликатов. Вот формула:

=UNIQUE(RANGE)

Примечание: Эта формула может выявить дубликаты только в одном столбце.

В этом методе есть только один шаг — ввод формулы в пустую ячейку. Продолжая использовать тот же набор данных, что и выше, я ввел =UNIQUE(A1:A10). Ниже показан список без дубликатов (слева).

Дублирование данных — бич электронных таблиц, особенно в масштабе.-10

Чтобы использовать функцию UNIQUE для поиска дубликатов в нескольких столбцах и строках, используйте эту формулу:

=UNIQUE(TOCOL(RANGE))

Дублирование данных — бич электронных таблиц, особенно в масштабе.-11

Недостатком использования функции UNIQUE для поиска дубликатов в Google Sheets является то, что вместо выделения и удаления дубликатов она выдает отдельный список без дубликатов. Это создает дополнительный шаг, поскольку вам придется вручную удалять дубликаты, используя новый список в качестве ссылки, поэтому я рекомендую этот метод для тех, у кого небольшой набор данных и кто не против нескольких ручных обновлений. Кроме того, этот метод — отличный вариант для составления чистого списка, чтобы начать с чистого листа.

Как удалить дубликаты в Google Sheets

Помимо выделения дубликатов, вы также можете использовать Google Sheets для удаления дубликатов с помощью функции очистки данных. Ниже я покажу вам, как это сделать.

Шаг 1: Выберите любую ячейку.

Шаг 2: Перейдите на заднюю панель инструментов, выберите «Данные», затем «Очистка данных», затем «Удалить дубликаты».

Дублирование данных — бич электронных таблиц, особенно в масштабе.-12

Шаг 3: Во всплывающем окне выберите столбцы, из которых нужно удалить дубликаты данных, затем выберите «Удалить дубликаты».

Примечание: Если у вас есть заголовок листа, обязательно выберите «Данные имеют строку заголовка», чтобы она не попала в поиск дубликатов.

Дублирование данных — бич электронных таблиц, особенно в масштабе.-13

Теперь все дубликаты исчезли!

Работа с дубликатами в дубликатах в Google Sheets

Можно ли выделить дубликаты в Google Sheets? Безусловно. Хотя этот процесс требует больше усилий, чем некоторые другие решения для работы с электронными таблицами, его легко повторить, сделав это один или два раза, а когда вы освоитесь с этим процессом, вы сможете масштабировать его, чтобы находить дубликаты в строках, столбцах и даже в гораздо больших наборах данных.

  📷
📷