Найти в Дзене
NTA

Операторы для фильтрации данных в Pandas

Фильтрация данных в Pandas DataFrame имеет свои особенности. Далее рассмотрим основные примеры. Для примера, создадим DataFrame: На всякий случай, далее приведены типы данных в DataFrame: В целом, простые вещи (вроде сравнения значений с использованием обычных логических операторов) реализованы довольно очевидно: Здесь мы просто взяли строки DataFrame, в которых значения по столбцу «numbers1» больше либо равны «2». Так же можно применять операторы к строкам и датам (причём даже без приведения типов): Однако, для поиска подстрок не получится просто написать df['a' in df['strings2']], необходимо применить специальную конструкцию: contains также поддерживает регулярные выражения: Помимо одиночных операторов можно использовать логические выражения с использованием операторов «и» и «или», которые в Pandas обозначены как «&» и «|»: Следует помнить о порядке выполнения операторов и расставлять скобки где это необходимо. Для поиска нескольких значений нужно использовать следующую конструкцию:
Автор: Нецепляев Денис, г. Ростов-на-Дону.#Pandas #DataFrame #лайфхаки
Автор: Нецепляев Денис, г. Ростов-на-Дону.#Pandas #DataFrame #лайфхаки

Фильтрация данных в Pandas DataFrame имеет свои особенности. Далее рассмотрим основные примеры.

Для примера, создадим DataFrame:

-2

На всякий случай, далее приведены типы данных в DataFrame:

-3

В целом, простые вещи (вроде сравнения значений с использованием обычных логических операторов) реализованы довольно очевидно:

-4

Здесь мы просто взяли строки DataFrame, в которых значения по столбцу «numbers1» больше либо равны «2».

Так же можно применять операторы к строкам и датам (причём даже без приведения типов):

-5

Однако, для поиска подстрок не получится просто написать df['a' in df['strings2']], необходимо применить специальную конструкцию:

-6

contains также поддерживает регулярные выражения:

-7

Помимо одиночных операторов можно использовать логические выражения с использованием операторов «и» и «или», которые в Pandas обозначены как «&» и «|»:

-8

Следует помнить о порядке выполнения операторов и расставлять скобки где это необходимо.

Для поиска нескольких значений нужно использовать следующую конструкцию:

-9

Для логического отрицания используется простой оператор «~»:

-10

Таким образом, комбинируя различные приведённые операторы и конструкции можно легко решать большинство задач на фильтрацию данных.

Читайте также: