Найти в Дзене
Аналитика данных

Если нужен «игрушечный» датафрейм для тестов

Например фейковый датафрейм, который будет имитировать данные о кредиторах. Возьмём библиотеку Faker для генерации реалистичных данных. В датафрейме будут следующие колонки: Создадим фейковый датафрейм, который будет имитировать данные о кредиторах. Воспользуемся библиотекой Faker для генерации реалистичных данных. В датафрейме будут следующие колонки: import pandas as pd
import numpy as np
from faker import Faker
import datetime # Текущая дата
today = datetime.datetime.now().date() # Инициализация Faker
fake = Faker() # Количество строк
n_rows = 1000 # Создаем случайные данные
np.random.seed(42)
Faker.seed(42) # Имя кредитора
creditor_name = [fake.name() for _ in range(n_rows)] # Дата выдачи кредита (за последний год)
loan_date = [fake.date_between(start_date='-1y', end_date=today) for _ in range(n_rows)] # Сумма кредита (от 1000 до 1 000 000)
loan_amount = np.random.uniform(1000, 1_000_000, size=n_rows) # Процентная ставка (от 5% до 20%)
interest_rate = np.random.uniform(5, 20, si
Оглавление

Например фейковый датафрейм, который будет имитировать данные о кредиторах. Возьмём библиотеку Faker для генерации реалистичных данных. В датафрейме будут следующие колонки:

Создадим фейковый датафрейм, который будет имитировать данные о кредиторах. Воспользуемся библиотекой Faker для генерации реалистичных данных. В датафрейме будут следующие колонки:

  • Имя кредитора (Creditor_Name) — случайные имена.
  • Дата выдачи кредита (Loan_Date) — случайные даты за последний год.
  • Сумма кредита (Loan_Amount) — случайные числа с плавающей точкой.
  • Процентная ставка (Interest_Rate) — случайные проценты.
  • Срок кредита (Loan_Term) — случайные целые числа (в месяцах).
  • Тип кредита (Loan_Type) — категориальные данные (например, "Ипотека", "Автокредит", "Потребительский кредит").
  • Статус кредита (Loan_Status) — категориальные данные (например, "Активный", "Погашен", "Просрочен").
  • Email кредитора (Creditor_Email) — случайные email-адреса.
  • Номер телефона кредитора (Creditor_Phone) — случайные номера телефонов.

Python-код

import pandas as pd
import numpy as np
from faker import Faker
import datetime
# Текущая дата
today =
datetime.datetime.now().date()
# Инициализация Faker
fake = Faker()
# Количество строк
n_rows = 1000
# Создаем случайные данные
np.random.seed(42)
Faker.seed(42)
# Имя кредитора
creditor_name = [
fake.name() for _ in range(n_rows)]
# Дата выдачи кредита (за последний год)
loan_date = [
fake.date_between(start_date='-1y', end_date=today) for _ in range(n_rows)]
# Сумма кредита (от 1000 до 1 000 000)
loan_amount = np.random.uniform(1000, 1_000_000, size=n_rows)
# Процентная ставка (от 5% до 20%)
interest_rate = np.random.uniform(5, 20, size=n_rows)
# Срок кредита (от 12 до 60 месяцев)
loan_term = np.random.randint(12, 60, size=n_rows)
# Тип кредита (категориальные данные)
loan_types = ['Ипотека', 'Автокредит', 'Потребительский кредит', 'Бизнес-кредит']
loan_type = np.random.choice(loan_types, size=n_rows)
# Статус кредита (категориальные данные)
loan_statuses = ['Активный', 'Погашен', 'Просрочен']
loan_status = np.random.choice(loan_statuses, size=n_rows)
# Email кредитора
creditor_email = [
fake.email() for _ in range(n_rows)]
# Номер телефона кредитора
creditor_phone = [
fake.phone_number() for _ in range(n_rows)]
# Создаем датафрейм
df = pd.DataFrame({
'Creditor_Name': creditor_name,
'Loan_Date': loan_date,
'Loan_Amount': loan_amount,
'Interest_Rate': interest_rate,
'Loan_Term': loan_term,
'Loan_Type': loan_type,
'Loan_Status': loan_status,
'Creditor_Email': creditor_email,
'Creditor_Phone': creditor_phone
})
# Смотрим что получилось
display(df)
df.info()

Объяснение

Имя кредитора: Генерируется с помощью fake.name().

Дата выдачи кредита: Случайные даты за последний год с помощью fake.date_between().

Сумма кредита: Случайные числа от 1000 до 1 000 000.

Процентная ставка: Случайные числа от 5% до 20%.

Срок кредита: Случайные целые числа от 12 до 60 месяцев.

Тип кредита: Категориальные данные из списка loan_types.

Статус кредита: Категориальные данные из списка loan_statuses.

Email кредитора: Генерируется с помощью fake.email().

Номер телефона кредитора: Генерируется с помощью fake.phone_number().