882 подписчика
#python #pandas #анализ данных #excel Pandas, безусловно, является одним из основных инструментов, необходимых для работы с данными в Python. Он предлагает множество различных способов фильтрации фреймов данных. Один из них я сегодня покажу на примере. Недавно подошла сотрудница с задачей — в файле нужно найти материалы на складах и сформировать файл для фильтрации по группам, чтобы можно удобно просмотреть в Excel. Количество материалов более 300 тысяч. Пример: При использовании библиотеки Левенштейна...
2 года назад
9,3K подписчиков
Наткнулся на метод в pandas, который до сих пор мне был не известен, но очень пригодился, когда захотелось порефакторить свой старый ноутбук, чтобы повысить удобочитаемость. Это метод query. Он дает возможность выбрать строки датафрейма, исходя из определенного условия, но при этом не ссылаясь на сам датафрейм, что позволяет оформлять обработку данных в стиле method chaining. К примеру, я хочу смерджить два датафрейма, а затем отфильтровать полученный результат по колонке из второго датафрейма...
2 года назад
13,7K подписчиков
Источник: Nuances of Programming Библиотека Python Pandas и язык структурированных запросов (SQL)  —  основные инструменты в арсенале специалиста по анализу данных. Хотя Pandas  —  мощный инструмент для работы с данными, многие специалисты с той же целью предпочитают использовать SQL. В этой статье будет рассказано, как выполнять манипуляции с данными в Pandas Dataframe, используя SQL с применением библиотеки pandasql. Что такое Pandasql? Pandasql  —  это библиотека Python, которая позволяет обрабатывать датафреймы Pandas с помощью SQL...
2 года назад