Найти тему
Властелин машин

Наглядный способ визуализации разницы в двух таблицах

Рассмотрим, простой метод получения разницы в двух датафреймах. Он идеально подойдет, когда надо убедиться в правильности примененных к таблице преобразований. Создадим демонстрационный датасет:

Создадим копию таблицы и внесем некоторые изменения:

-2

Теперь воспользуемся методом compare:

-3

С параметрами по умолчанию compare показывает только строки и колонки с различающимися значениями. При этом для каждого столбца слева (self) указывается значение первого датафрейма в заданной строке, а справа (other) - второго. NaN обозначают равные значения.

С параметром keep_equal=True в итоговом датафрейме вместо NaN-ов будут реальные значения:

-4

С keep_shape=True результат будет включать все строки и колонки, а не только различающиеся:

-5

Также можно задать имена подстолбцов, в которых будут содержаться значения ячеек левого и правого датафрейма вместо наименований по умолчанию - 'self', 'other'. Это регулируется параметром result_names:

-6

-7