Исследователи из Массачусетского технологического института (MIT) разработали tspDB — систему прогнозирования, которая работает с любыми рядами временных данных и доступна для использования неспециалистами. Результаты экспериментов показали, что данные алгоритмы эффективнее существующих методов глубокого машинного обучения.
Прогнозирование значений показателей, изменяющихся со временем, таких, например, как погода, цена на акции или риск развития заболевания, осуществляется на основе анализа исторических данных. Чтобы построить качественный прогноз, нужно использовать сложные алгоритмы машинного обучения, которые трудно применять неспециалистам.
Чтобы сделать инструменты прогнозирования доступнее, программисты MIT разработали систему, которая интегрирует функции прогнозирования поверх существующей базы данных временных рядов. Упрощенный интерфейс системы tspDB выполняет все сложное моделирование без участия пользователя.
Пользователю системы достаточно нажать несколько клавиш, чтобы получить прогноз — расчет осуществляется в среднем за 0,9 мс. Система также рассчитывает доверительные интервалы, учитывая степень неопределенности прогноза.
В качестве основы для своего алгоритма исследователи взяли анализ сингулярного спектра (SSA). С использованием этого метода можно вычислять значения и строить прогнозы на основе отдельных временных рядов. Программисты из MIT доработали алгоритм, чтобы исключить необходимость ручной настройки переменных. Решение, предложенное исследователями, заключалось в том, чтобы «сложить» матрицы отдельных временных рядов в одну большую матрицу, к которой может быть применен SSA.
Результаты тестирования показали, что новый алгоритм превзошел все предыдущие аналоги. Разработчики также показали универсальный характер алгоритма: он может одинаково эффективно применяться к любым временным рядам. Исследователи говорят, что продолжат совершенствовать tspDB, добавляя в нее новые алгоритмы, которые еще больше повысят точность прогнозов, а также намерены сделать tspDB широко используемой системой с открытым исходным кодом.