Найти в Дзене
Властелин машин

Групповые статистики с Python

Оглавление

Рассмотрим наиболее распространенные кейсы получения групповых статистик с помощью библиотеки Pandas. Разбирать вопрос будем на примере статистики о боях по смешанным единоборствам в рамках американской лиги UFC (выберем данные только для заданных бойцов):

Вывод одной агрегации по некоторому столбцу

Операции группировки по некоторым колонкам проводим с помощью метода groupby. Так, выводится среднее по количеству нокаутов в минуту (колонка kd_stat) для выбранных бойцов:

-2

Вывод нескольких агрегаций по столбцам

Для этих целей можно воспользоваться методом agg (или синонимом - aggregate), передав ему список функций. Выведем для бойцов общее число и количество разных оппонентов:

-3

Вывод выборочных агрегаций для выборочных столбцов

Реализуется посредством передачи методу agg словаря с указанием столбцов (ключи) и соответствующих каждому агрегаций (значения):

-4

Заданий кастомной функции агрегации

Осуществляется с помощью метода apply:

-5

Несколько колонок группировки

Если группировка задается по нескольким колонкам (задаются списком в groupby), то агрегация работает аналогичным образом:

-6

-7