Временная метка – набор кодированных символов, характеризующих время того или иного события в программировании.
Это специальный формат временной метки в модуле Python datetime:
А это – временная метка на языке библиотеки Pandas:
А здесь – временная метка на языке библиотеки NumPy:
В отличие от Временного ряда (Time Series), который характеризует столбец Датафрейма (DataFrame), временная метка характеризует отдельную ячейку этого столбца.
Временная метка и datetime
Правильно подготовить Признак (Feature), выраженный временной меткой, можно с помощью библиотеки datetime. Для начала импортируем все необходимые надстройки:
Подгрузим небольшой Датасет (Dataset), содержащий данные о покупках в магазине сувениров:
Наш набор выглядит следующим образом:
Зачастую Pandas поверхностно "обходится" с признаками датафрейма и интерпретирует их как объекты. Посмотрим, к каким типам данных он относит временной ряд InvoiceDate , выраженный временной меткой. Для этого используем встроенный метод Pandas.dtypes:
Удивительно, но факт: помимо причисления столбца временной метки к объектам, Pandas к тому же решил интерпретировать подобным образом и другие признаки – номер счета (InvoiceNo), артикул (StockCode), страну (Country). Возможно, это делается намеренно, чтобы Дата-сайентист (Data Scientist) обратил внимание на очевидные несоответствия и скорее переназначил(-а) признакам типы:
Восстановим справедливость, по крайней мере, к признаку "Дата выставления счета" и изменим тип на временную метку методом dt.to_datetime() , который умен настолько, что даже не потребует Регулярного выражения (Regular Expression) с описанием формата даты:
Тип столбца обновился. Система самостоятельно преобразовала объект во временную метку, и признак превратился во Временной ряд (Time Series):
Ноутбук, не требующий дополнительной настройки на момент написания статьи, можно скачать здесь.