Найти в Дзене
Властелин машин

Сводные таблицы, зачем нужны и простые способы создания

Сводные таблицы предназначены для подсчета определенных групповых статистик в ваших данных. Фактически это некая трансформация от представления информации в "кусочном" виде в удобные для человека агрегированные, общие статистики.
При этом обойтись без такой манипуляции не получится, так как на практике затруднительно постоянно поддерживать аналитическое представление данных. Эта процедура была бы

Сводные таблицы предназначены для подсчета определенных групповых статистик в ваших данных. Фактически это некая трансформация от представления информации в "кусочном" виде в удобные для человека агрегированные, общие статистики.

При этом обойтись без такой манипуляции не получится, так как на практике затруднительно постоянно поддерживать аналитическое представление данных. Эта процедура была бы чересчур затратна. К тому же уровень развития современных информационных технологий позволяет без труда проводить анализ данных, фиксируемых в любом пригодном для чтения виде.

Таким образом, на этапе сбора и записи информации приоритетным является скорость, соответственно, в сведениях, как правило, отсутствует какая-либо аналитическая составляющая. В то же время для формирования выводов и принятия решений по данным требуется проводить их анализ с использованием таких инструментов, как сводные таблицы.

Рассмотрим задачу. Имеется журнал хозяйственных операций, в которых определенные организации оказывают друг другу услуги за фиксированные выплаты:

-2

Требуется определить общие суммы денежных потоков, поступивших в адрес организаций за оказанные ими услуги. Если данные хранятся в Microsoft Excel или Google Таблицах можно построить сводную таблицу встроенными средствами. В частности, в Google Таблицах соответствующая функция располагается в меню Данные -> Создать сводную таблицу Excel вкладка вставка -> сводная таблица). При этом требуется сначала указать ее местоположение на текущем или новом листе (указав ячейку положения ее левого верхнего угла) а также диапазон ячеек, используемых для ее построения:

-3

Затем нажимаем Создать и в появившейся форме указываем имена столбцов исходной таблицы, которые должны располагаться по строкам и столбцам сводной таблицы, а также участвовать в агрегации (раздел Значения):

-4

В данном случае программа будет искать совпадающие пары значений из столбцов Кто и Кому и считать их сумму (именно такая функция указана в нижнем поле - SUM). В результате получится следующая таблица:

-5

Последний столбец Итого будет содержать сумму значений по строкам (например, А1 оказал услуги на 136000 р.).

Данный порядок действий необходим для построения сводной таблицы в Microsoft Excel или Google Таблицах. Еще большую гибкость имеет работа с использованием языка программирования Python. Например, скачаем нашу таблицу в формате csv на локальный диск, а затем считаем функцией библиотеки Pandas (псевдоним pd) - read_csv:

-6

Для очистки таблицы требуется задать ряд параметров:

skip_rows - количество пропускаемых строк;

usecols - номера используемых столбцов;

header - номер строки с заголовком;

nrows - количество считываемых строк;

parse_dates - номера столбцов, содержащих даты для их преобразования в соответствующий тип (иначе будут считаны как строки).

Далее сводная таблица строится функцией pivot_table:

-7

Для ее работы также необходимо задать имена столбцов исходной таблицы, которые должны располагаться по строкам (параметр index) и столбцам (columns) сводной таблицы, а также участвовать в подсчете статистики (values), функцию агрегации (aggfunc). Параметр margins регулирует необходимость отображения итоговой статистики по столбцам и строкам. Ниже представляю результат работы функции:

-8