Источник: Nuances of Programming Используемый набор данных Мы будем использовать знаменитый набор данных Titanic. Импортируем его и получаем следующее: 1. idxmin() and idxmax() Эти функции возвращают индексную позицию определенной записи. В наборе данных Titanic, например, можно найти индексную позицию самого молодого/старого человека. Попробуем найти только имена этих людей. Многие программисты используют следующий подход, поскольку не знают о существовании idxmin() и idxmax(): Не самый чистый код, но бывает и хуже. Теперь рассмотрим, как добиться подобного результата с помощью выше упомянутых функций: Результаты идентичны, но код стал немного короче и чище. 2. cut() cut() используется, чтобы поместить значения в дискретные интервалы. Например, в наборе данных Titanic есть атрибут Age, который является непрерывным. Допустим, вы хотите рассчитать соотношение выживших/погибших для определенной возрастной группы. Идея состоит в том, чтобы разделить столбец Age на 5 сегментов: Предпочитае
3 функции Pandas, которые стоит использовать чаще
29 июня 202029 июн 2020
46
1 мин