Рассмотрим наиболее распространенные кейсы получения групповых статистик с помощью библиотеки Pandas. Разбирать вопрос будем на примере статистики о боях по смешанным единоборствам в рамках американской лиги UFC (выберем данные только для заданных бойцов):
Вывод одной агрегации по некоторому столбцу
Операции группировки по некоторым колонкам проводим с помощью метода groupby. Так, выводится среднее по количеству нокаутов в минуту (колонка kd_stat) для выбранных бойцов:
Вывод нескольких агрегаций по столбцам
Для этих целей можно воспользоваться методом agg (или синонимом - aggregate), передав ему список функций. Выведем для бойцов общее число и количество разных оппонентов:
Вывод выборочных агрегаций для выборочных столбцов
Реализуется посредством передачи методу agg словаря с указанием столбцов (ключи) и соответствующих каждому агрегаций (значения):
Заданий кастомной функции агрегации
Осуществляется с помощью метода apply:
Несколько колонок группировки
Если группировка задается по нескольким колонкам (задаются списком в groupby), то агрегация работает аналогичным образом: