203 читали · 6 лет назад
Анализ данных с помощью pandas. Часть 3: объединение и группировка данных
Эта часть показывает способы группировки, объединения и дополнения данных. In [1]: %matplotlib inline import pandas as pd import matplotlib.pyplot as plt plt.style.use('ggplot') plt.rcParams['figure.figsize'] = (10, 5) Вернемся к нашему набору данных о велосипедистах. Допустим, я живу в Монреале, и мне любопытно, используется ли велосипед для пригородных поездок, или для развлечения - люди больше катаются на велосипеде в выходные дни или в будние? Добавляем столбец "день недели" Загрузим данные In [2]: bikes = pd...
150 читали · 5 лет назад
Matplotlib VS Ggplot2: выбираем лучший способ визуализации
Говоря о лучших способах визуализации, у специалистов может завязаться серьезный спор. Что лучше Matplotlib на Python или Ggplot2 на R. Мы постараемся объективно рассудить этот спор, испытав каждый способ в максимально равных условиях...
1460 читали · 5 лет назад
Извлечение групповых статистик с Pandas
В Pandas имеется большой набор групповых операций, позволяющих извлекать различные полезные сводные показатели. Для группировки значений таблицы по одному или нескольким меткам/индексам у объектов DataFrame существует метод groupby...