Найти в Дзене
Властелин машин

Сводные агрегации c Pandas

Рассмотрим, какие агрегирующие функции можно задавать в pivot_table и как определять собственные методы. Для примера будем работать со следующим датафреймом:

Для создания сводных статистик можно использовать функцию pivot_table, в параметр aggfunc которой передаются функции агрегации (поддерживаются как строчные наименования, так и ссылки). Например, сгруппируем по полю gr_id и посчитаем метрики для revenue:

-2

К числу наиболее часто используемых статистик относятся count, nunique, min, max, std, sum, mean, median, var, quantile:

-3

Обратите внимание, что quantile по умолчанию возвращает медиану, чтобы передать значение квантили можно воспользоваться partial и передать в pivot_table ссылку:

-4

Также в pivot_table можно передавать собственные функции:

-5

И лямбда функции:

-6

-7

Наука
7 млн интересуются