416 читали · 2 года назад
Рассказываю как ускорить циклы в 60 раз Python (pandas)
Недавно я экспериментировал с циклами в Python и понял, что использование 'iloc' / 'loc' внутри циклов требует много времени для выполнения. Следующий вопрос заключался в том, почему «loc» занимает слишком много времени и какова альтернатива «loc»? В этой статье мы ответим на эти вопросы, рассмотрев несколько практических примеров. Что такое loc — если вы еще не знаете! Функция loc[] — это функция pandas, которая используется для доступа к значениям внутри DataFrame с использованием индекса строки и имени столбца...
1172 читали · 4 года назад
Эффективное итерирование по строкам в Pandas DataFrame
Источник: Nuances of Programming Начиная заниматься машинным обучением, я следовал рекомендациям и создавал собственные характеристики, комбинируя несколько столбцов в наборе данных. И делал я это ужасно неэффективно, теряя по несколько минут на самые простые операции. Проблема была проста: я не знал, как эффективно выполнять итерации по строкам в Pandas. В интернете встречается немало людей, поступающих так же. Используемые ими методы не элегантны, но вполне подходят для небольших объемов данных...
Изучение табличных данных на Python
От стадии загрузки данных (см. статью) перейдем к их основательному изучению Двигаться будем от простого к сложному и сначала разберемся со способами выборки нужных данных. Напоминаю, что мы работаем с таблицей о поединках, организованных UFC в период c ноября 1993 г. по июнь 2019 г., которая состоит из 5144 строк и 145 столбцов и имеет следующий вид: Предположим, мы намерены анализировать столбец «weight_class» (весовая категория). Выборка столбца в объекте DataFrame производится путем указания...
1252 читали · 5 лет назад
Работа с данными с нуля
Базовой структурой для работы с данными в языке программирования Python является библиотека Pandas, позволяющая создавать табличные объекты на основе собственной или внешней информации. В последующем с...