422 читали · 3 года назад
Эффективное итерирование по строкам в Pandas DataFrame
Источник: Nuances of Programming Начиная заниматься машинным обучением, я следовал рекомендациям и создавал собственные характеристики, комбинируя несколько столбцов в наборе данных. И делал я это ужасно неэффективно, теряя по несколько минут на самые простые операции. Проблема была проста: я не знал, как эффективно выполнять итерации по строкам в Pandas. В интернете встречается немало людей, поступающих так же. Используемые ими методы не элегантны, но вполне подходят для небольших объемов данных...
462 читали · 4 года назад
4 способа добавления колонок в датафреймы Pandas
Источник: Nuances of Programming Pandas — это библиотека для анализа и обработки данных, написанная на языке Python. Она предоставляет множество функций и способов для управления табличными данными. Основная структура данных Pandas — это датафрейм, который хранит информацию в табличной форме с помеченными строками и столбцами. В контексте данных строки представляют собой утверждения, или точки данных. Столбцы отражают свойства, или атрибуты утверждений. Рассмотрим эту структуру на простом примере...