443 читали · 3 года назад
4 способа добавления колонок в датафреймы Pandas
Источник: Nuances of Programming Pandas — это библиотека для анализа и обработки данных, написанная на языке Python. Она предоставляет множество функций и способов для управления табличными данными. Основная структура данных Pandas — это датафрейм, который хранит информацию в табличной форме с помеченными строками и столбцами. В контексте данных строки представляют собой утверждения, или точки данных. Столбцы отражают свойства, или атрибуты утверждений. Рассмотрим эту структуру на простом примере...
482 читали · 6 лет назад
День 3: Смотрим данные. Pandas
Как правило все начинается с данных. Данные могут быть в абсолютно разном формате, например в виде csv-файлов (достаточно распространённый случай). Прежде чем двигаться дальше убедитесь, что вы зарегистрированы в kaggle и у вас установлен CLI клиент kaggle - <ссылка на kaggle нарратив> Подробнее о том, что это такое можно почитая здесь. Возьмём небольшой набор данных о студентах в формате CSV (comma separated values). Читаем данные с помощью shell команд Первое, что логично было бы сделать - посмотреть что это за данные...