Пользователи периодически жаловались на "вылеты" фоновых заданий, долгое выполнение операций и т.п. Ошибка была плавающая.
Используется база ERP в кластере с четырьмя серверами 1С. Для анализа ситуации решили посмотреть загрузку оборудования на всех серверах, а также включить сбор показателей, которые могут указывать на повышенную нагрузку процессора на сервере 1С. В первую очередь это показатель Серверный вызов.
Монитор позволяет видеть данные сразу с нескольких серверов, поэтому довольно быстро мы выяснили, что в случайные промежутки времени увеличивалась нагрузка процессора на одном из серверов 1С до 90-100% и держалась в диапазоне 30 - 60 сек. При этом каждый раз это мог быть любой из четырёх серверов.
На графике ситуация выглядела следующим образом: Добавили на график другие показатели ("Долгий запрос", "Ошибка тех. журнала", "Серверный вызов"), но именно с показателем "Серверный вызов" была явная корреляция. Длительность вызова почти полностью совпадала с длительностью высокой