Источник: Nuances of Programming Библиотека Python Pandas и язык структурированных запросов (SQL) — основные инструменты в арсенале специалиста по анализу данных. Хотя Pandas — мощный инструмент для работы с данными, многие специалисты с той же целью предпочитают использовать SQL. В этой статье будет рассказано, как выполнять манипуляции с данными в Pandas Dataframe, используя SQL с применением библиотеки pandasql. Что такое Pandasql? Pandasql — это библиотека Python, которая позволяет обрабатывать датафреймы Pandas с помощью SQL...
До этого момента, мы получали данные только из CSV файлов. Это довольно распространенный способ сохранения данных, но далеко не единственный! Pandas может работать с данными из HTML, JSON, SQL, Excel (!!!), HDF5, stata, и некоторых других вещей...