1 год назад
Убираем повторы с Pandas LeetCode 196
Всем привет, сегодня маленькая задачка на Pandas Нужно было убрать дублирующиеся email. Причем оставить нужно было email с минимальным id. Для этого сначала сделал сортировку таблицы по колонке «id» методом ...
4065 читали · 4 года назад
Выявление и фильтрация дубликатов с Pandas
Рассмотрим задачу выявления и удаления дублирующих значений в массивах информации с библиотекой Pandas. В демонстрационных целях будем использовать набор объявлений о продажах квартир в Республике Северная Осетия-Алания, имеющий следующий вид: Для определения дублирующих данных можно воспользоваться методом duplicated, в котором при желании задается подмножество столбцов, одинаковые значения в которых являются признаком дубликата (параметр subset, по умолчанию равен None - все столбцы), а также стратегию...