Источник: Nuances of Programming Pandas — широко распространённая Python-библиотека для работы со структурированными данными. По её использованию уже составлено большое количество уроков, однако, я хотел бы рассказать о нескольких небольших хитростях, которые могут оказаться полезными. read_csv Эта команда вам хорошо знакома. Если данные, которые вы пытаетесь считать, слишком большие, то попробуйте добавить этот аргумент: nrows = 5, чтобы считать только часть таблицы, прежде чем загрузить её полностью...
В ходе обработки массивов данных зачастую приходится преобразовывать датафреймы в иные объекты для совместимости с другими модулями. Рассмотрим основные структуры на примере следующей таблицы: import pandas as pd
df = pd.DataFrame([['id1', 'key_new1','key_old1'], ['id2','key_new2','key_old2'],
['id3', 'key_new3','key_old3'], ['id4','key_new4','key_old4']],
columns=['id', 'new', 'old'])
df NumPy массив Хоть многие модули и поддерживают Pandas, стандартом де-факто...