468 читали · 4 года назад
4 способа добавления колонок в датафреймы Pandas
Источник: Nuances of Programming Pandas — это библиотека для анализа и обработки данных, написанная на языке Python. Она предоставляет множество функций и способов для управления табличными данными. Основная структура данных Pandas — это датафрейм, который хранит информацию в табличной форме с помеченными строками и столбцами. В контексте данных строки представляют собой утверждения, или точки данных. Столбцы отражают свойства, или атрибуты утверждений. Рассмотрим эту структуру на простом примере...
Как приручить JSON в Pandas: от новичка до профи
Все мы сталкивались с этой ситуацией. Ты получаешь выгрузку из базы данных или API, открываешь её в Pandas и видишь... это. Столбцы, в которых вместо аккуратных чисел и строк находится одна сплошная текстовая «колбаса» из фигурных скобок, кавычек и двоеточий. Да, это он — JSON, завёрнутый в ячейку таблицы. Сначала это вызывает панику. Как извлечь из этого хаоса нужную информацию? Как достать имя клиента, если оно запрятано на третьем уровне вложенности? Что делать, если в одной ячейке хранится список из десяти товаров? Без паники! Работа с JSON в Pandas — это не магия, а навык...