#python #pandas #анализ данных #excel Pandas, безусловно, является одним из основных инструментов, необходимых для работы с данными в Python. Он предлагает множество различных способов фильтрации фреймов данных. Один из них я сегодня покажу на примере. Недавно подошла сотрудница с задачей — в файле нужно найти материалы на складах и сформировать файл для фильтрации по группам, чтобы можно удобно просмотреть в Excel. Количество материалов более 300 тысяч. Пример: При использовании библиотеки Левенштейна пришлось бы использовать цикл в цикле, при большом количестве данных проверка могла бы затянутся на долго. Анализ данных требует много операций фильтрации. Pandas предоставляют множество методов для фильтрации фрейма данных, и Dataframe.query() является одним из них. import pandas as pd
pd.options.display.max_columns = None
mPath1=r"C:\Users\niki\Desktop\RACK"
PATH = mPath1+"\\Материалы.XLSX"
f1 = open((mPath1+ '\\1205_01_sort.csv'),mode="a", encoding="utf-8")
df = p