Найти в Дзене
Властелин машин

Перемешивание и выборка строк в Pandas датафрейме

Рассмотрим, как, используя встроенные в Pandas возможности, перемешать строки таблицы или осуществить их случайную выборку. Для наглядности будем использовать следующий датафрейм: Если ваша задача - просто перемешать таблицу, то вызовите метод sample с параметром frac=1: Если сохранение индекса не важно, то сразу воспользуйтесь методом reset_index(drop=True) (как в закомментированной строке выше). Метод sample также поможет, если вам интересно выбрать только несколько строк. При этом для задания доли используйте параметр frac, а конкретного числа - n. Например, выберем случайно 3 строки или 20%: С параметром replace=True можно осуществлять выборку с возвращением: Как можно заметить, в итоговой таблице есть повторы.

Рассмотрим, как, используя встроенные в Pandas возможности, перемешать строки таблицы или осуществить их случайную выборку. Для наглядности будем использовать следующий датафрейм:

Если ваша задача - просто перемешать таблицу, то вызовите метод sample с параметром frac=1:

-2

Если сохранение индекса не важно, то сразу воспользуйтесь методом reset_index(drop=True) (как в закомментированной строке выше).

Метод sample также поможет, если вам интересно выбрать только несколько строк. При этом для задания доли используйте параметр frac, а конкретного числа - n. Например, выберем случайно 3 строки или 20%:

-3

С параметром replace=True можно осуществлять выборку с возвращением:

-4

Как можно заметить, в итоговой таблице есть повторы.

-5