Добавить в корзинуПозвонить
Найти в Дзене
Властелин машин

Выборка колонок датафрейма по типам

Как правило, наибольшего успеха добивается тот, кто располагает лучшей информацией (Бенджамин Дизраэли). Рассмотрим, предпочтительный способ выборки колонок датафрейма по типам. Для начала сгенерируем демонстрационный набор данных: В датасете представлены разные типы колонок: Рассмотрим, как корректно выбрать колонки заданных типов с помощью метода select_dtypes, который в аргументах include/exclude принимает список типов колонок для отбора/фильтрации и возвращает датафрейм. Целый тип Его выборка производится по строке integer (или np.integer): Другие вариации приведут к отбору не всех колонок: Тип с плавающей точкой Задавайте строку floating: а так не правильно: Численный тип Численные колонки (и float, и int) отбираем по ключевому слову number: Логический тип Задаем ключевое слово bool: Категориальный тип Используйте ключевое слово category: Строчный тип Колонки со строками возвращаются при указании object (однако среди них могут быть колонки с встроенными питоновскими типами): Дата
Оглавление

Как правило, наибольшего успеха добивается тот, кто располагает лучшей информацией (Бенджамин Дизраэли). Рассмотрим, предпочтительный способ выборки колонок датафрейма по типам. Для начала сгенерируем демонстрационный набор данных:

В датасете представлены разные типы колонок:

-2

Рассмотрим, как корректно выбрать колонки заданных типов с помощью метода select_dtypes, который в аргументах include/exclude принимает список типов колонок для отбора/фильтрации и возвращает датафрейм.

Целый тип

Его выборка производится по строке integer (или np.integer):

-3

Другие вариации приведут к отбору не всех колонок:

-4

Тип с плавающей точкой

Задавайте строку floating:

-5

а так не правильно:

-6

Численный тип

Численные колонки (и float, и int) отбираем по ключевому слову number:

-7

Логический тип

Задаем ключевое слово bool:

-8

Категориальный тип

Используйте ключевое слово category:

-9

Строчный тип

Колонки со строками возвращаются при указании object (однако среди них могут быть колонки с встроенными питоновскими типами):

-10

Дата и время

Для получения используйте строку datetime:

-11

Период

Используйте ссылку на тип - pd.PeriodDtype:

-12

Так как для получения списка колонок сначала возвращается датафрейм, если он большой, лучше получать типы из его среза. Для разнообразия получим колонки, исключая дробные:

-13

-14