569 читали · 5 лет назад
Анализ данных с помощью pandas. Часть 7: работа с датами и временем
Часто данные содержат не только числовые или строковые значения, но и даты / время, причём в огромном множестве разных форматов. pandas умеет работать с датами; в этой части будет показано, как. Unix timestamps Самый распространённый формат в Unix. Неочевидно, что делать с Unix timestamp в pandas. Файл, который мы будем использовать - "popularity-contest", найденный в папке /var/log/popularity-contest. Что это за файл? In [1]: %matplotlib inline import pandas as pd import matplotlib.pyplot as plt import numpy as np plt...
3 года назад
Главные объекты для работы с датой и временем в Pandas
Модели машинного обучения, базирующиеся на временных рядах, требуют хороших навыков обработки даты и времени. В этой статье рассмотрим основные объекты, представляющие необходимый функционал в Pandas. Метки даты и времени Для меток даты и времени в Pandas предназначен тип Timestamp - аналог datetime.datetime из стандартной библиотеки Python и основанный на типе numpy.datetime64. Конструкция из нескольких Timestamp называется DatetimeIndex. Проще всего создать Timestamp, используя строчную нотацию: Чтобы сгенерировать диапазон Timestamp, следует воспользоваться функцией date_range...