Найти в Дзене
Python и всё такое

Python и всё такое

Разные решения на python, интересные библиотеки и фичи
подборка · 4 материала
2 месяца назад
Способы визуализации пропущенных данных
Код python: import matplotlib.pyplot as plt import pandas as pd df = pd.read_excel('src/sales.xlsx') df.info() // Out: 0 id_order 35554 non-null object 1 id_buyer 35554 non-null object 2 id_manager 35554 non-null object 3 id_good 35554 non-null object 4 unit 35554 non-null object 5 date 35554 non-null object 6 quantity 35520 non-null float64 7 amount 32230 non-null float64 8 cost_price 34287 non-null float64 9 costs 26139 non-null float64 import seaborn as sns plt.figure(figsize=(12, 8)) sns.heatmap(df...
9 месяцев назад
Временные периоды dt.to_period
Аналитика данных с использованием временных периодов dt.to_period. Например, есть данные по продажам. Среди данных: дата продажи, и сумма продажи. Необходимо разбить продажи по периодам. Чтобы определить к какому периоду относится та или иная дата используем функцию to_period. Пишем python-код: # Импорт пандаса, куда же без него import pandas as pd # Исходный датафрейм df = pd.DataFrame({ 'Было': ['2023-01-10 10:12:05', '2023-02-17 12:52:06', '2024-03-13 20:42:03', '2024-04-15 21:11:15', '2025-05-09...
10 месяцев назад
Логирование в Data-аналитике
Если написать код который например будет по API выкачивать данные и оставить компьютер работать на несколько часов, то может произойти что-то непредвиденное. И чтобы потом разобраться что же пошло не так, нам помогут лог-файлы. # Импорт библиотеки логирование import logging # Инициализация логера logging.basicConfig( level=logging.INFO, # Уровень логирования: INFO и выше format='%(asctime)s - %(levelname)s - %(message)s', # Формат сообщения filename='app.log', # Лог-файл filemode='a', # Режим добавления...
11 месяцев назад
Если нужен «игрушечный» датафрейм для тестов
Например фейковый датафрейм, который будет имитировать данные о кредиторах. Возьмём библиотеку Faker для генерации реалистичных данных. В датафрейме будут следующие колонки: Создадим фейковый датафрейм, который будет имитировать данные о кредиторах. Воспользуемся библиотекой Faker для генерации реалистичных данных. В датафрейме будут следующие колонки: import pandas as pd import numpy as np from faker import Faker import datetime # Текущая дата today = datetime.datetime.now().date() # Инициализация Faker fake = Faker() # Количество строк n_rows = 1000 # Создаем случайные данные np...