В операционных метриках и в HR метриках в частности, есть одна особенность: данные почти никогда не ведут себя ровно, даже если процесс внутри компании не менялся ни на процент. Сегодня закрыли пачку простых вакансий - показатель выглядит низким, а завтра в тот же месяц закрылись две длинные позиции, которые тянулись с весны - и график уже рисует тревогу. И если смотреть на такие метрики по месяцам, то у вас в руках оказывается не инструмент управления, а источник эмоциональных качелей.
Скользящее среднее нужно ровно затем, чтобы перевести взгляд с отдельных всплесков на базовый уровень. Оно не делает данные какими-то особенными или красивыми, оно делает их читаемыми - так, чтобы вы могли ответить на главный управленческий вопрос: скорость процесса реально изменилась или это может быть просто шум распределения, сезонность и эффект маленьких чисел.
Что такое скользящее среднее простыми словами
Если сказать максимально просто, то скользящее среднее - это когда вы смотрите не на один месяц в одиночку, а на окно из нескольких месяцев и каждый раз пересчитываете среднее по этому окну. То есть значение за март - это среднее за январь+февраль+март, значение за апрель - это среднее за февраль+март+апрель, и так далее, то есть окно перемещается во времени вместе с вашими данными.
В результате вы перестаёте видеть каждый случайный пик как событие, которое надо срочно объяснять, и начинаете видеть направление всей метрики, а это именно то, что нужно для решений. Через скользящее можно смотреть на процесс немного шире.
Почему обычное среднее за месяц часто вводит в заблуждение
Помесячная агрегация кажется естественной, но в реальных HR-данных (и не только HR) она легко становится ловушкой из-за двух вещей, которые почти всегда присутствуют одновременно.
Первая - неравномерный объём наблюдений. В одном месяце вы закрыли 60 вакансий, в другом 30. Формально это всё ещё “месяц”, но статистически здесь совершенно разная устойчивость, потому что чем меньше наблюдений, тем сильнее на итог влияет каждый отдельный случай. Один длинный месяц с 30-ю наблюдениями весит как два длинных месяца с 60-ю, и на графике это может выглядеть как ухудшение процесса, хотя это быть может попросту особенность выборки.
Вторая - длинный хвост распределения. Срок закрытия вакансий почти никогда не нормален, он обычно асимметричен: много обычных закрытий и немного очень долгих, которые тянут среднее сильно вверх. Скользящее среднее не корректирует никак этот хвост, но оно помогает не принимать хвост за тренд.
Сначала объём, потом скорость
Прежде чем обсуждать скорость закрытия вакансий, часто полезно взглянуть на объём закрытий по месяцам, потому что объём - это контекст, который способен объяснить половину аномалий в данных. Когда объём проваливается, график скорости становится нервным не потому что рекрутинг стал хуже, а потому что стало меньше наблюдений и каждый отдельный кейс начал сильнее двигать итог.
Вот пример графика “сколько вакансий закрывали по месяцам” и скользящее среднее за 3 месяца, которое показывает базовый ритм и сглаживает случайные пики и провалы.
Если вы сделаете только одну вещь после чтения этого текста, пусть это будет она: всегда держите рядом линию объёма, потому что она защищает от ложных выводов, когда вам хочется объяснить почему та или иная метрика поехала куда-то, а на самом деле просто поехала выборка.
Среднее, медиана и скользящее
Дальше начинается самая полезная комбинация для HR: показывать среднее и медиану одновременно, а потом добавлять к ним скользящее среднее (например, за 3 месяца), чтобы видеть и так называемую типичную вакансию, и влияние хвоста, и еще при этом иметь спокойную линию базового уровня.
Вот пример на месячных данных: линии среднего и медианы и их скользящее за 3 месяца.
Обратите внимание на ощущение от графика: средняя и медиана почти всегда заставляют глаз цепляться за пики, а скользящие линии делают то, что обычно делает опытный аналитик в голове - они переводят внимание на то, что держится дольше одного месяца.
Как выбрать окно: 3, 6 или 12 месяцев
Окно скользящего среднего - это всегда компромисс между чувствительностью и стабильностью.
Окно 3 месяца обычно хорошо, если вы хотите увидеть изменения достаточно быстро, но при этом уже не реагировать на каждый единичный всплеск.
Окно 6 месяцев полезно, когда сезонность выражена сильнее и вам важно увидеть более устойчивый уровень, который не меняется от пары месяцев.
Окно 12 месяцев превращает показатель в почти макро-срез: оно сглаживает почти всё, но и реагирует медленно, поэтому подходит скорее для годовой истории и стратегического планирования.
На практике мне больше нравится окно в 3 месяца, это как базовый вариант использования, а если данные очень волнообразные, то рядом можно добавить 6 месяцев, чтобы отделить всплеск от тренда.
В качестве вывода
Скользящее среднее не исправляет методологические ошибки. Если вы поменяли определение какого-то атрибута, если смешали в одной линии массовый подбор и редкие инженерные позиции, если в данных есть дубликаты или пропуски, то сглаживание сделает картинку красивее, но не информативнее.
Я регулярно разбираю такие темы в своём Telegram-канале, если вам интересно глубже понимать аналитику и работать с данными, там регулярно выходят короткие заметки и практические примеры.