10,2 тыс подписчиков

Python, управляем данными

7 мая 20227 мая 2022

190

2 мин

Оглавление

Установка
Через anaconda

Анализ различных статистических показателей, представленных временными рядами, это необходимая часть современных научных прикладных исследований в науке о даннных

Пакет Python для постраения уравнения SDE из данных временных рядов.

PyDaddy — это полезнный и простой в использовании пакет Python для получения стохастических дифференциальных уравнений на основе данных из временных рядов. PyDaddy который принимает временной ряд переменной состояния (x) в качестве входных данных и выводит SDE в форме:

где η(t) — некоррелированный белый шум.

Функция f называется дрейфом и управляет детерминированной частью ураавненния.

g2 называется диффузией и определяет стохастическиую фуннкцию динамики.

В PyDaddy реализованы специальные функции визуализации и анализа данных, которые помогают пользователю интерпретировать свои данные.

Установка

PyDaddy доступен для установки через PyPi, и в anaconda и работает с python3.

pip install pydaddy

или

pip install git+https://github.com/tee-lab/PyDaddy.git

Через anaconda

conda install -c tee-lab pydaddy

Кроме того, пакет также можно установить, клонировав/загрузив репозиторий git и запустив файл setup.py.

git clone https://github.com/tee-lab/PyDaddy.git
cd PyDaddy
python setup.py install

Функции PyDaddy

Аализ временных рядов в пару строк кода
Способен различать системы с похожим поведением в устойчивом состоянии.
Создает интуитивно понятное представление данных и полученного результата.
Поддерживает данные временных рядов как со скалярными, так и с векторными значениями .
Помогает понять изменения в порядке дрейфа и распространения в различных временных масштабах.
Генерирует интерактивные, дрейфовые и диффузионные данные для заданного пользователем диапазона или списка временной шкалы.

Инициализация объекта pydaddy

Чтобы начать анализ, нам нужно создать объект pydaddy с нашим набором данных. Это позволит паукету вычислить дрейф в данных и создать сводный график визуализации. Чтобы инициализировать объект pydaddy, нам нужно передать следующие аргументы:

data: данные временных рядов могут быть одномерными или двумерными. Для пример будет иметь дело с 1D данными. pydaddy предполагает, что выборки расположены равномерно. data передается в виде массивов Numpy

t: Это может быть либо скаляр, обозначающий временной интервал между выборками, либо массив, обозначающий отметку времени каждой выборки.

Ниже приведены некоторые полезные необязательные аргументы (подробное описание каждого необязательного аргумента см. в документации).

В этом примере используется образец набора данных, загруженный с помощью функции. load_sample_dataset Подробнее о форматах данных и загрузке/сохранении данных см.