366 читали · 3 года назад
4 способа добавления колонок в датафреймы Pandas
Источник: Nuances of Programming Pandas — это библиотека для анализа и обработки данных, написанная на языке Python. Она предоставляет множество функций и способов для управления табличными данными. Основная структура данных Pandas — это датафрейм, который хранит информацию в табличной форме с помеченными строками и столбцами. В контексте данных строки представляют собой утверждения, или точки данных. Столбцы отражают свойства, или атрибуты утверждений. Рассмотрим эту структуру на простом примере...
Выборка колонок датафрейма по типам
Как правило, наибольшего успеха добивается тот, кто располагает лучшей информацией (Бенджамин Дизраэли). Рассмотрим, предпочтительный способ выборки колонок датафрейма по типам. Для начала сгенерируем демонстрационный набор данных: В датасете представлены разные типы колонок: Рассмотрим, как корректно выбрать колонки заданных типов с помощью метода select_dtypes, который в аргументах include/exclude принимает список типов колонок для отбора/фильтрации и возвращает датафрейм. Целый тип Его выборка производится по строке integer (или np...