566 читали · 4 года назад
Анализ данных с помощью pandas. Часть 7: работа с датами и временем
Часто данные содержат не только числовые или строковые значения, но и даты / время, причём в огромном множестве разных форматов. pandas умеет работать с датами; в этой части будет показано, как. Unix timestamps Самый распространённый формат в Unix. Неочевидно, что делать с Unix timestamp в pandas. Файл, который мы будем использовать - "popularity-contest", найденный в папке /var/log/popularity-contest. Что это за файл? In [1]: %matplotlib inline import pandas as pd import matplotlib.pyplot as plt import numpy as np plt...
2 года назад
Подготовка важного отчёта Python Pandas
Jan 19, 2022 Поставлена аналитическая задача, проанализировать динамику продаж по выбранным контрагентам за определенный период в сравнении с предыдущим. Вроде бы всё просто, но есть нюанс. При выгрузке данных из корпоративной системы получается порядка 3,7 млн. строк. Кроме того, необходимо предоставить данные в специальном разрезе. Такой разбивки в системе нет. Необходимо воспользоваться несколькими вспомогательными классификаторами. Связать таблицы по полю артикул. Привожу алгоритм обработки данных Python с помощью библиотеки Pandas: Ноутбук для формирования отчёта (для публикации коммерческие данные удалены)...