Доброго здоровья читателям моего канала programmer's notes. Подписываемся и ставим лайки.
pandas, экспорт таблиц DataFrame
Данная статья является продолжением статей: статья 1, статья 2, статья 3, статья 4.
Сегодня рассматриваем возможности экспорта данных из таблиц DataFrame.
Экспорт в файлы csv
Экспорт осуществляется методом to_csv().
Пример
#!/usr/bin/python3
import numpy as np
import pandas as pd
people = {'Фамилия': ['Иванов', 'Петров', 'Сидоров', 'Душечкина'],
'Год рождения': [1999, 1988, 1997, 2001],
'Зарплата': [88000.3, 65000.2, 70000.4, 75000.9]}
fr = pd.DataFrame(people)
fr.to_csv('tbl.csv', index=False)
В результате будет создан файл tbl.csv с данными таблицы
Экспорт в таблицы xlsx
Экспорт осуществляется методом to_excel().
Предварительно нужно установить библиотеку openpyxl обычным образом, если она не установлена
pip3 install openpyxl
Пример 1
#!/usr/bin/python3
import numpy as np
import pandas as pd
people = {'Фамилия': ['Иванов', 'Петров', 'Сидоров', 'Душечкина'],
'Год рождения': [1999, 1988, 1997, 2001],
'Зарплата': [88000.3, 65000.2, 70000.4, 75000.9]}
fr = pd.DataFrame(people)
fr.to_excel('tbl.xlsx', index=False)
В результате будет создан файл tbl.xlsx
Пример 2. Экспорт на несколько листов
#!/usr/bin/python3
import numpy as np
import pandas as pd
from pandas import ExcelWriter
people = {'Фамилия': ['Иванов', 'Петров', 'Сидоров', 'Душечкина'],
'Год рождения': [1999, 1988, 1997, 2001],
'Зарплата': [88000.3, 65000.2, 70000.4, 75000.9]}
fr = pd.DataFrame(people)
wr = ExcelWriter('tbl.xlsx')
fr.to_excel(wr, index=False, sheet_name='First')
fr.to_excel(wr, index=False, sheet_name='Second')
wr.close()
Будет создан файл электронных таблиц с двумя листами и таблицами на них
Экспорт в json
Экспорт осуществляется методом to_json().
Пример
#!/usr/bin/python3
import numpy as np
import pandas as pd
people = {'Фамилия': ['Иванов', 'Петров', 'Сидоров', 'Душечкина'],
'Год рождения': [1999, 1988, 1997, 2001],
'Зарплата': [88000.3, 65000.2, 70000.4, 75000.9]}
fr = pd.DataFrame(people)
fr.to_json('j.json', orient = 'split', compression = 'infer', index = 'true')
В результате будет создан файл json, работать с которым мы умеем
Ниже описаны основные параметры метода to_json
- path_or_buf — куда экспортируем, обычно это файл или буфер. По умолчанию — None.
- orient — формат json. Значения: «split», «records», «index», «columns» и «values». По умолчанию — «columns».
- date_format — формат даты, используемый для столбцов, похожих на дату, во фрейме данных. Это может быть любая строка формата datetime. По умолчанию — None.
- double_precision — точность чисел с плавающей запятой в json. Это целое значение - количество десятичных разрядов. По умолчанию равно 10.
- force_ascii — следует ли кодировать символы, отличные от ASCII, в Юникоде. Значение по умолчанию равно True.
- date_unit — единица измерения временной метки в столбцах, с датами. Могут быть: s - для секунд, ms - для миллисекунд и us - для микросекунд.
Пока всё!
Занимаемся программированием и посещаем мой канал, посвящённый программированию на Python.