361 подписчик
Часто данные содержат не только числовые или строковые значения, но и даты / время, причём в огромном множестве разных форматов. pandas умеет работать с датами; в этой части будет показано, как. Unix timestamps Самый распространённый формат в Unix. Неочевидно, что делать с Unix timestamp в pandas. Файл, который мы будем использовать - "popularity-contest", найденный в папке /var/log/popularity-contest. Что это за файл? In [1]: %matplotlib inline import pandas as pd import matplotlib.pyplot as plt import numpy as np plt...
4 года назад
592 подписчика
Модели машинного обучения, базирующиеся на временных рядах, требуют хороших навыков обработки даты и времени. В этой статье рассмотрим основные объекты, представляющие необходимый функционал в Pandas. Метки даты и времени Для меток даты и времени в Pandas предназначен тип Timestamp - аналог datetime.datetime из стандартной библиотеки Python и основанный на типе numpy.datetime64. Конструкция из нескольких Timestamp называется DatetimeIndex. Проще всего создать Timestamp, используя строчную нотацию: Чтобы сгенерировать диапазон Timestamp, следует воспользоваться функцией date_range...
2 года назад
592 подписчика
Разбор строковых полей с информацией о дате и времени встречается повсеместно, соответственно, любой анализ временного ряда не обходится без знания базовых возможностей по обработке эти данных. Если имеющаяся в pandas функция pandas.to_datetime() произведет автоматический разбор строки и трансформирует ее значения в тип даты, можно считать, что вам повезло, так как вся сложная работа выполнена за вас. В противном случае строковые данные нужно привести к одному из распространенных видов представления даты и времени...
3 года назад