Хирьянов Т.Ф. - Основы программирования и анализа данных на Python - 10. Библиотека Pandas
Передовые методы Pandas.
Pandas — библиотека Python для анализа данных, используемая для обработки и преобразования больших наборов данных. Освоение передовых методов Pandas может повысить эффективность и качество анализа. В этой статье мы рассмотрим обработку пропущенных данных, работу с многоиндексными DataFrame и способы оптимизации производительности. Пропущенные данные могут искажать результаты анализа и моделей машинного обучения. Pandas предоставляет гибкие инструменты для выявления и обработки таких данных. 1. Идентификация...
Анализ данных с помощью pandas. Часть 5: ищем самый снежный месяц
Мы уже видели, что pandas хорошо умеет обращаться с датами. Но он также хорошо умеет работать со строками! Возьмём наши данные из предыдущей части. In [1]: %matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
pd.options.display.max_rows = 7
plt.style.use('ggplot')
plt.rcParams['figure.figsize'] = (15, 3)
plt.rcParams['font.family'] = 'sans-serif' In [2]: weather_2012 = pd.read_csv('data/weather_2012.csv', parse_dates=True, index_col='Date/Time')
weather_2012[:5]...