Сводные таблицы предназначены для подсчета определенных групповых статистик в ваших данных. Фактически это некая трансформация от представления информации в "кусочном" виде в удобные для человека агрегированные, общие статистики.
При этом обойтись без такой манипуляции не получится, так как на практике затруднительно постоянно поддерживать аналитическое представление данных. Эта процедура была бы чересчур затратна. К тому же уровень развития современных информационных технологий позволяет без труда проводить анализ данных, фиксируемых в любом пригодном для чтения виде.
Таким образом, на этапе сбора и записи информации приоритетным является скорость, соответственно, в сведениях, как правило, отсутствует какая-либо аналитическая составляющая. В то же время для формирования выводов и принятия решений по данным требуется проводить их анализ с использованием таких инструментов, как сводные таблицы.
Рассмотрим задачу. Имеется журнал хозяйственных операций, в которых определенные организации оказывают друг другу услуги за фиксированные выплаты:
Требуется определить общие суммы денежных потоков, поступивших в адрес организаций за оказанные ими услуги. Если данные хранятся в Microsoft Excel или Google Таблицах можно построить сводную таблицу встроенными средствами. В частности, в Google Таблицах соответствующая функция располагается в меню Данные -> Создать сводную таблицу (в Excel вкладка вставка -> сводная таблица). При этом требуется сначала указать ее местоположение на текущем или новом листе (указав ячейку положения ее левого верхнего угла) а также диапазон ячеек, используемых для ее построения:
Затем нажимаем Создать и в появившейся форме указываем имена столбцов исходной таблицы, которые должны располагаться по строкам и столбцам сводной таблицы, а также участвовать в агрегации (раздел Значения):
В данном случае программа будет искать совпадающие пары значений из столбцов Кто и Кому и считать их сумму (именно такая функция указана в нижнем поле - SUM). В результате получится следующая таблица:
Последний столбец Итого будет содержать сумму значений по строкам (например, А1 оказал услуги на 136000 р.).
Данный порядок действий необходим для построения сводной таблицы в Microsoft Excel или Google Таблицах. Еще большую гибкость имеет работа с использованием языка программирования Python. Например, скачаем нашу таблицу в формате csv на локальный диск, а затем считаем функцией библиотеки Pandas (псевдоним pd) - read_csv:
Для очистки таблицы требуется задать ряд параметров:
skip_rows - количество пропускаемых строк;
usecols - номера используемых столбцов;
header - номер строки с заголовком;
nrows - количество считываемых строк;
parse_dates - номера столбцов, содержащих даты для их преобразования в соответствующий тип (иначе будут считаны как строки).
Далее сводная таблица строится функцией pivot_table:
Для ее работы также необходимо задать имена столбцов исходной таблицы, которые должны располагаться по строкам (параметр index) и столбцам (columns) сводной таблицы, а также участвовать в подсчете статистики (values), функцию агрегации (aggfunc). Параметр margins регулирует необходимость отображения итоговой статистики по столбцам и строкам. Ниже представляю результат работы функции: