423 читали · 3 года назад
Эффективное итерирование по строкам в Pandas DataFrame
Источник: Nuances of Programming Начиная заниматься машинным обучением, я следовал рекомендациям и создавал собственные характеристики, комбинируя несколько столбцов в наборе данных. И делал я это ужасно неэффективно, теряя по несколько минут на самые простые операции. Проблема была проста: я не знал, как эффективно выполнять итерации по строкам в Pandas. В интернете встречается немало людей, поступающих так же. Используемые ими методы не элегантны, но вполне подходят для небольших объемов данных...
847 читали · 5 лет назад
Извлечение групповых статистик с Pandas
В Pandas имеется большой набор групповых операций, позволяющих извлекать различные полезные сводные показатели. Для группировки значений таблицы по одному или нескольким меткам/индексам у объектов DataFrame существует метод groupby...