Найти тему
Машинное обучение

Python, управляем данными

Оглавление

Анализ различных статистических показателей, представленных временными рядами, это необходимая часть современных научных прикладных исследований в науке о даннных

Пакет Python для постраения уравнения SDE из данных временных рядов.

PyDaddy — это полезнный и простой в использовании пакет Python для получения стохастических дифференциальных уравнений на основе данных из временных рядов. PyDaddy который принимает временной ряд переменной состояния (x) в качестве входных данных и выводит SDE в форме:

где η(t) — некоррелированный белый шум.

Функция f называется дрейфом и управляет детерминированной частью ураавненния.

g2 называется диффузией и определяет стохастическиую фуннкцию динамики.

В PyDaddy реализованы специальные функции визуализации и анализа данных, которые помогают пользователю интерпретировать свои данные.

Установка

PyDaddy доступен для установки через PyPi, и в anaconda и работает с python3.

pip install pydaddy

или

pip install git+https://github.com/tee-lab/PyDaddy.git

Через anaconda

conda install -c tee-lab pydaddy

Кроме того, пакет также можно установить, клонировав/загрузив репозиторий git и запустив файл setup.py.

git clone https://github.com/tee-lab/PyDaddy.git
cd PyDaddy
python setup.py install

Функции PyDaddy

  • Аализ временных рядов в пару строк кода
  • Способен различать системы с похожим поведением в устойчивом состоянии.
  • Создает интуитивно понятное представление данных и полученного результата.
  • Поддерживает данные временных рядов как со скалярными, так и с векторными значениями .
  • Помогает понять изменения в порядке дрейфа и распространения в различных временных масштабах.
  • Генерирует интерактивные, дрейфовые и диффузионные данные для заданного пользователем диапазона или списка временной шкалы.

Инициализация объекта pydaddy

Чтобы начать анализ, нам нужно создать объект pydaddy с нашим набором данных. Это позволит паукету вычислить дрейф в данных и создать сводный график визуализации. Чтобы инициализировать объект pydaddy, нам нужно передать следующие аргументы:

data: данные временных рядов могут быть одномерными или двумерными. Для пример будет иметь дело с 1D данными. pydaddy предполагает, что выборки расположены равномерно. data передается в виде массивов Numpy

t: Это может быть либо скаляр, обозначающий временной интервал между выборками, либо массив, обозначающий отметку времени каждой выборки.

Ниже приведены некоторые полезные необязательные аргументы (подробное описание каждого необязательного аргумента см. в документации).

В этом примере используется образец набора данных, загруженный с помощью функции. load_sample_dataset Подробнее о форматах данных и загрузке/сохранении данных см.

-2
-3

Еще пример:

ddsde.summary()
-4
-5
Machinelearning

Документация: https://pydaddy.readthedocs.io/

#dataanalytics #software #datascientist #javascript #iot #java #coder #ml #analytics #webdevelopment

Наука
7 млн интересуются