В этой статье я бы хотела собрать в одном месте инструменты для предварительной обработки данных. Ведь практически всегда прежде чем данные анализировать, их сначала надо привести в порядок. Например, в полученных данных исключить лишние пробелы или разбить текст по столбцам. 1. Удаление повторяющихся строк. Когда вы соединяете данные из разных баз может получиться так, что одна и таже строка повторяется в разных источниках. Для того, чтобы ее удалить, необходимо установить курсор в любую из ячеек диапазона ваших данных, на ленте перейти на вкладку Данные -> Работа с данными и нажать "Удалить дубликаты". Откроется диалоговое окно: В открывшемся окне представлены столбцы, которые должны быть учтены при анализе на наличие дубликатов. Если вы отметите все столбцы, то дубликатом будут считаться строки, полностью совпадающие по всем значениям. Если вы выделите, например, только первый столбец "Клиент", то при поиске дубликатов будет вестись поиск совпадения только по первому столбцу. При эт