Найти в Дзене
SkyNet | Новости ИИ

Cisco выпустила модель временных рядов Cisco Time Series Model: первая модель с открытыми весами на основе архитектуры Transformer с одним

Cisco выпустила модель временных рядов Cisco Time Series Model: первая модель с открытыми весами на основе архитектуры Transformer с одним декодером Cisco и Splunk представили модель временных рядов Cisco Time Series Model — одномерную модель временных рядов с нулевым выстрелом, разработанную для показателей наблюдаемости и безопасности. Она выпущена в виде контрольной точки с открытыми весами на Hugging Face под лицензией Apache 2.0. Модель предназначена для прогнозирования рабочих нагрузок без тонкой настройки под конкретные задачи. Почему для наблюдаемости нужен мультиразрешающий контекст? Производственные показатели — это не просто сигналы с одним масштабом. Недельные закономерности, долгосрочный рост и насыщение видны только при грубом разрешении. События насыщения, всплески трафика и динамика инцидентов проявляются при разрешении в 1 минуту или 5 минут. Общие модели временных рядов работают с одним разрешением с контекстными окнами от 512 до 4096 точек, в то время как TimesFM

Cisco выпустила модель временных рядов Cisco Time Series Model: первая модель с открытыми весами на основе архитектуры Transformer с одним декодером

Cisco и Splunk представили модель временных рядов Cisco Time Series Model — одномерную модель временных рядов с нулевым выстрелом, разработанную для показателей наблюдаемости и безопасности. Она выпущена в виде контрольной точки с открытыми весами на Hugging Face под лицензией Apache 2.0. Модель предназначена для прогнозирования рабочих нагрузок без тонкой настройки под конкретные задачи.

Почему для наблюдаемости нужен мультиразрешающий контекст?

Производственные показатели — это не просто сигналы с одним масштабом. Недельные закономерности, долгосрочный рост и насыщение видны только при грубом разрешении. События насыщения, всплески трафика и динамика инцидентов проявляются при разрешении в 1 минуту или 5 минут.

Общие модели временных рядов работают с одним разрешением с контекстными окнами от 512 до 4096 точек, в то время как TimesFM 2.5 расширяет это до 16384 точек. Для данных с разрешением в 1 минуту это всё равно охватывает максимум пару недель, а часто и меньше.

Это проблема наблюдаемости, когда платформы данных часто сохраняют только старые данные в агрегированном виде. Детальные образцы устаревают и сохраняются только в виде часовых сводок. Модель временных рядов Cisco разработана для такого шаблона хранения. Она рассматривает грубую историю как входные данные первого класса, которые улучшают прогнозы с высоким разрешением.

Архитектура работает напрямую с мультиразрешающим контекстом, а не притворяется, что все входные данные находятся в одной сетке.

Входные данные мультиразрешения и цель прогнозирования

Формально модель потребляет пару контекстов: (xc, xf). Грубый контекст (xc) и тонкий контекст (xf) имеют длину до 512. Расстояние между (xc) фиксировано в 60 раз больше расстояния между (xf).

Типичная настройка наблюдаемости использует 512 часов часовых агрегатов и 512 минут значений с разрешением в 1 минуту. Оба ряда заканчиваются в одной точке прогноза. Модель прогнозирует горизонт в 128 точек с высоким разрешением, со средним значением и набором квантилей от 0,1 до 0,9.

Архитектура: ядро TimesFM с встраиванием разрешений

Внутри модель временных рядов Cisco повторно использует стек декодеров на основе патчей TimesFM. Входные данные нормализуются, разбиваются на неперекрывающиеся фрагменты и пропускаются через блок встраивания с остаточным подключением.

Ядро трансформатора состоит из 50 слоёв, работающих только с декодером. Последний остаточный блок сопоставляет токены обратно с горизонтом. Исследовательская группа удаляет позиционные встраивания и вместо этого полагается на порядок патчей, мультиразрешающую структуру и новое встраивание разрешения для кодирования структуры.

Два дополнения делают архитектуру мультиразрешающей. Специальный токен, часто называемый ST в отчёте, вставляется между грубыми и тонкими потоками токенов. Он находится в пространстве последовательностей и отмечает границу между разрешениями. Встраивания разрешений, часто называемые RE, добавляются в пространстве модели. Один вектор встраивания использует...

Читать далее