10,2 тыс подписчиков
⚡️ Как только вы перейдете на Parquet...
...вы никогда не вернетесь к CSV.
Parquet — это формат хранения данных, разработанный для эффективного анализа больших объемов данных.
Он обеспечивает высокую производительность чтения и записи, а также поддерживает сжатие данных, что позволяет сэкономить место на диске.
В Python существует несколько библиотек для работы с форматом Parquet, наиболее популярной из них является pyarrow.
pip install pyarrow
import pyarrow.parquet as pq
# Чтение данных из файла Parquet
table = pq.read_table('example.parquet')
df = table.to_pandas() # Преобразование таблицы Parquet в объект pandas DataFrame
# Запись данных в файл Parquet
table = pq.Table.from_pandas(df)
pq.write_table(table, 'example.parquet')
#junior #parquet
Около минуты
11 февраля 2024