Рассмотрим, простой метод получения разницы в двух датафреймах. Он идеально подойдет, когда надо убедиться в правильности примененных к таблице преобразований. Создадим демонстрационный датасет: Создадим копию таблицы и внесем некоторые изменения: Теперь воспользуемся методом compare: С параметрами по умолчанию compare показывает только строки и колонки с различающимися значениями. При этом для каждого столбца слева (self) указывается значение первого датафрейма в заданной строке, а справа (other) - второго. NaN обозначают равные значения. С параметром keep_equal=True в итоговом датафрейме вместо NaN-ов будут реальные значения: С keep_shape=True результат будет включать все строки и колонки, а не только различающиеся: Также можно задать имена подстолбцов, в которых будут содержаться значения ячеек левого и правого датафрейма вместо наименований по умолчанию - 'self', 'other'. Это регулируется параметром result_names:
Наглядный способ визуализации разницы в двух таблицах
4 августа 20234 авг 2023
31
~1 мин