Хирьянов Т.Ф. - Основы программирования и анализа данных на Python - 10. Библиотека Pandas
Анализ данных с помощью pandas. Часть 1: Чтение данных из csv файла
Эта часть показывает способ обработки данных, хранящихся в формате csv, а также построение простейших графиков. Необходимые импорты и настройки In [1]: # Рисовать графики сразу же
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
plt.style.use('ggplot') # Красивые графики
plt.rcParams['figure.figsize'] = (15, 5) # Размер картинок Чтение из csv файла Можно читать данные из CSV файла с помощью функции read_csv. По умолчанию предполагается, что поля разделены запятыми. Мы рассмотрим некоторые данные о велосипедистах Монреаля...
День 3: Смотрим данные. Pandas
Как правило все начинается с данных. Данные могут быть в абсолютно разном формате, например в виде csv-файлов (достаточно распространённый случай). Прежде чем двигаться дальше убедитесь, что вы зарегистрированы в kaggle и у вас установлен CLI клиент kaggle - <ссылка на kaggle нарратив> Подробнее о том, что это такое можно почитая здесь. Возьмём небольшой набор данных о студентах в формате CSV (comma separated values). Читаем данные с помощью shell команд Первое, что логично было бы сделать - посмотреть что это за данные...