Программирование. Обработка строк Python 3, функции, методы, циклы, find(), count(), split()
Эффективное итерирование по строкам в Pandas DataFrame
Источник: Nuances of Programming Начиная заниматься машинным обучением, я следовал рекомендациям и создавал собственные характеристики, комбинируя несколько столбцов в наборе данных. И делал я это ужасно неэффективно, теряя по несколько минут на самые простые операции. Проблема была проста: я не знал, как эффективно выполнять итерации по строкам в Pandas. В интернете встречается немало людей, поступающих так же. Используемые ими методы не элегантны, но вполне подходят для небольших объемов данных...
Рассказываю как ускорить циклы в 60 раз Python (pandas)
Недавно я экспериментировал с циклами в Python и понял, что использование 'iloc' / 'loc' внутри циклов требует много времени для выполнения. Следующий вопрос заключался в том, почему «loc» занимает слишком много времени и какова альтернатива «loc»? В этой статье мы ответим на эти вопросы, рассмотрев несколько практических примеров. Что такое loc — если вы еще не знаете! Функция loc[] — это функция pandas, которая используется для доступа к значениям внутри DataFrame с использованием индекса строки и имени столбца...