Найти в Дзене
Елена Скворцова

Python для анализа годовых температур в Москве

Python - это мощный язык программирования, который широко используется в области анализа данных, включая анализ погодных данных. Давайте на примере анализа годовых температур в Москве разберемся как с его помощью можно выгрузить, предобработать и визуализировать данные новичку в этом деле.

Для начала, вам потребуется получить доступ к погодным данным. Вы можете использовать API, такие как OpenWeatherMap API, для получения данных о погоде. OpenWeatherMap API предоставляет доступ к текущим и историческим данным о погоде по всему миру.

Информационный ресурс: https://rp5.ru/Погода_в_Москве_(ВДНХ)

В нашем примере обойдемся без использования API и ограничимся загрузкой архива погодных данных с информационного ресурса https://rp5.ru/Погода_в_Москве_(ВДНХ)
В нашем примере обойдемся без использования API и ограничимся загрузкой архива погодных данных с информационного ресурса https://rp5.ru/Погода_в_Москве_(ВДНХ)
-2

Скачиваем архив данных за интересующий период в формате csv или xls, сохраняем его у себя на ПК.  Затем, вы можете использовать библиотеки Python, такие как Pandas и Plotly, для анализа и визуализации данных. Pandas позволяет вам эффективно работать с табличными данными, а Plotly - создавать графики и визуализации.

В нашем примере будем использовать Pandas для чтения данных из файла excel, а затем использовать функции Pandas для фильтрации, группировки и агрегации данных.

Для начала загрузим все необходимые библиотеки (в первой ячейке с кодом). С помощью функции “pd.read_excel” прочитаем архив с погодными данными, не забудьте указать путь до файла на вашем пк. Поменяем названия колонок на более удобные.
Для начала загрузим все необходимые библиотеки (в первой ячейке с кодом). С помощью функции “pd.read_excel” прочитаем архив с погодными данными, не забудьте указать путь до файла на вашем пк. Поменяем названия колонок на более удобные.
На этапе предобработки данных переведем все “временные” данные (год, месяц, дата, время и тд.) в формат timestamp для удобства работы с ними в будущем.
На этапе предобработки данных переведем все “временные” данные (год, месяц, дата, время и тд.) в формат timestamp для удобства работы с ними в будущем.

С помощью функции “groupby” сгруппируем данные по годам, а к данным температуры применим агрегацию минимумом, максимумом, суммой и средним.

Найдем медианные значения каждой из получившихся переменных и посчитаем относительные отклонения от медианной годовой температуры.

Из получившигося датасета изобразим отклонения от медианного значения температуры на графике. Будем использовать библиотеку Plotly для его создания.
Из получившигося датасета изобразим отклонения от медианного значения температуры на графике. Будем использовать библиотеку Plotly для его создания.
-6

Вот таким нехитрым способом мы подготовили и визуализировали погодные данные по Москве для дальнейшего анализа и поиска отклонений с помощью языка программирования Python. У нас получился интерактивный дашборд, который можно сохранить как отдельно взятое изображение, можно оставить визуализацию только минимальной, максимальной или средней температуры с помощью интерактивных кнопок легенды в правом верхнем углу.