Найти в Дзене

Timestamp в Машинном обучении простыми словами

Фото: @crisaur
Фото: @crisaur

Временная метка – набор кодированных символов, характеризующих время того или иного события в программировании.

Это специальный формат временной метки в модуле Python datetime:

-2

А это – временная метка на языке библиотеки Pandas:

-3

А здесь – временная метка на языке библиотеки NumPy:

-4

В отличие от Временного ряда (Time Series), который характеризует столбец Датафрейма (DataFrame), временная метка характеризует отдельную ячейку этого столбца.

Временная метка и datetime

Правильно подготовить Признак (Feature), выраженный временной меткой, можно с помощью библиотеки datetime. Для начала импортируем все необходимые надстройки:

-5

Подгрузим небольшой Датасет (Dataset), содержащий данные о покупках в магазине сувениров:

-6

Наш набор выглядит следующим образом:

-7

Зачастую Pandas поверхностно "обходится" с признаками датафрейма и интерпретирует их как объекты. Посмотрим, к каким типам данных он относит временной ряд InvoiceDate , выраженный временной меткой. Для этого используем встроенный метод Pandas.dtypes:

-8

Удивительно, но факт: помимо причисления столбца временной метки к объектам, Pandas к тому же решил интерпретировать подобным образом и другие признаки – номер счета (InvoiceNo), артикул (StockCode), страну (Country). Возможно, это делается намеренно, чтобы Дата-сайентист (Data Scientist) обратил внимание на очевидные несоответствия и скорее переназначил(-а) признакам типы:

-9

Восстановим справедливость, по крайней мере, к признаку "Дата выставления счета" и изменим тип на временную метку методом dt.to_datetime() , который умен настолько, что даже не потребует Регулярного выражения (Regular Expression) с описанием формата даты:

-10

Тип столбца обновился. Система самостоятельно преобразовала объект во временную метку, и признак превратился во Временной ряд (Time Series):

-11

Ноутбук, не требующий дополнительной настройки на момент написания статьи, можно скачать здесь.