145 читали · 3 года назад
Удобная визуализация частичных дубликатов в Python
Методы выявления и фильтрации дубликатов (duplicated, drop_duplicates) в библиотеке Pandas я уже освещал ранее. Вместе с тем для исследования объектов с частью одинаковых значений и понимания сути расхождений требуются дополнительные знания в части более тонкого применения функций и комбинации с другими методами. Рассмотрим вопрос на примере игрушечного датафрейма следующего вида: Обычный вызов duplicated приведет к пометке в качестве дубликатов и выводу только части данных (по умолчанию первые...
06:44
1,0×
00:00/06:44
854,6 тыс смотрели · 4 года назад