882 подписчика
#parquet #csv #xlsx #Pandas Pandas оптимизирован для работы с данными больших объёмов – вычисления и операции в нём, при правильном использовании инструмента, проводятся очень быстро. Благодаря этому часто складывается ситуация, когда больше всего времени тратится на операции чтения и записи данных, что характерно для многих задач. Тем не менее, ожидание прочтения очередного csv или xlsx файла может раздражать. Для оптимизации работы с данными был создан формат parquet. Parquet – это бинарный, колоночно-ориентированный формат хранения данных, изначально созданный для экосистемы Hadoop...
2 года назад