101 читали · 4 года назад
Анализ данных с помощью pandas. Часть 3: объединение и группировка данных
Эта часть показывает способы группировки, объединения и дополнения данных. In [1]: %matplotlib inline import pandas as pd import matplotlib.pyplot as plt plt.style.use('ggplot') plt.rcParams['figure.figsize'] = (10, 5) Вернемся к нашему набору данных о велосипедистах. Допустим, я живу в Монреале, и мне любопытно, используется ли велосипед для пригородных поездок, или для развлечения - люди больше катаются на велосипеде в выходные дни или в будние? Добавляем столбец "день недели" Загрузим данные In [2]: bikes = pd...
5 лет назад
Прорабатываем навык группировки и визуализации данных в Python
Сегодня будем прорабатывать навык использования средств группирования и визуализации данных в Python. В предоставленном датасете на Github проанализируем несколько характеристик и построим набор визуализаций. По традиции, в начале, определим цели: Меньше слов, больше кода! И, поехали. Сгруппируем данные по полу и году и визуализируем общую динамику рождаемости обоих полов Найдем самые популярные имена за всю историю Разобьём весь временной промежуток в данных на 10 частей и для каждой найдем самое популярное имя каждого пола...