582 читали · 5 лет назад
Анализ данных с помощью pandas. Часть 1: Чтение данных из csv файла
Эта часть показывает способ обработки данных, хранящихся в формате csv, а также построение простейших графиков. Необходимые импорты и настройки In [1]: # Рисовать графики сразу же %matplotlib inline import pandas as pd import matplotlib.pyplot as plt plt.style.use('ggplot') # Красивые графики plt.rcParams['figure.figsize'] = (15, 5) # Размер картинок Чтение из csv файла Можно читать данные из CSV файла с помощью функции read_csv. По умолчанию предполагается, что поля разделены запятыми. Мы рассмотрим некоторые данные о велосипедистах Монреаля...
569 читали · 5 лет назад
Анализ данных с помощью pandas. Часть 7: работа с датами и временем
Часто данные содержат не только числовые или строковые значения, но и даты / время, причём в огромном множестве разных форматов. pandas умеет работать с датами; в этой части будет показано, как. Unix timestamps Самый распространённый формат в Unix. Неочевидно, что делать с Unix timestamp в pandas. Файл, который мы будем использовать - "popularity-contest", найденный в папке /var/log/popularity-contest. Что это за файл? In [1]: %matplotlib inline import pandas as pd import matplotlib.pyplot as plt import numpy as np plt...