Рассмотрим, простой метод получения разницы в двух датафреймах. Он идеально подойдет, когда надо убедиться в правильности примененных к таблице преобразований. Создадим демонстрационный датасет:
Создадим копию таблицы и внесем некоторые изменения:
Теперь воспользуемся методом compare:
С параметрами по умолчанию compare показывает только строки и колонки с различающимися значениями. При этом для каждого столбца слева (self) указывается значение первого датафрейма в заданной строке, а справа (other) - второго. NaN обозначают равные значения.
С параметром keep_equal=True в итоговом датафрейме вместо NaN-ов будут реальные значения:
С keep_shape=True результат будет включать все строки и колонки, а не только различающиеся:
Также можно задать имена подстолбцов, в которых будут содержаться значения ячеек левого и правого датафрейма вместо наименований по умолчанию - 'self', 'other'. Это регулируется параметром result_names: