361 подписчик
Главная проблема загрязненных данных: понять, они загрязнены или нет? Используем данные NYC 311 service request из одной из прошлых статей, так как их много и они неочевидны. In [1]: %matplotlib inline import pandas as pd import matplotlib.pyplot as plt import numpy as np pd.options.display.max_rows = 7 plt.style.use('ggplot') plt.rcParams['figure.figsize'] = (15, 3) plt.rcParams['font.family'] = 'sans-serif' In [2]: requests = pd.read_csv('data/311-service-requests.csv') /usr/local/lib/python3...
4 года назад