Найти тему

Как провести профилактику оборудования без простоев?

Работа работой, а профилактика оборудования — по расписанию. Это касается не только производственного комплекса, но и программно-аппаратного. И если несоразмерную нагрузку или ошибку программирования устраняют относительно легко и быстро, то, например, ремонт сервера или обновление его операционной системы — нет. Что делать, чтобы провести все необходимые работы без простоя?

ТЕХНОНИКОЛЬ внедрила систему резервирования: у нас есть сменные блоки питания и диски для хранения данных, которые позволяют нам делать «горячую замену», то есть менять блоки на ходу. И так последовательно выводятся из эксплуатации сервер за сервером, после чего на них выполняются профилактические работы и обновления. Чаще такие операции проводятся ночью или в выходные дни, когда нагрузка на систему минимальная.

Другой вид работ связан с развитием информационной системы. Меняется Корпорация — меняется и система, нужны регулярные остановки для проведения обновлений, корректировок. В этом случае мы придерживались двух ключевых подходов:

1. Сокращение количества и времени проведения профилактик за счёт ритмичного графика внесения изменений в систему.

2. Разделение монолитной большой системы на части, чтобы разные модули можно было резервировать и выводить из эксплуатации поочерёдно.

Понадобилось несколько лет на настройку оборудования, приведение его к единой целевой архитектуре, внесение значительных изменений в саму информационную систему. Теперь мы стараемся планировать работы: выбираем наиболее удобное время, чтобы у клиентов не было сбоев при использовании сервисов. Это того стоит: время простоя системы из-за профилактик сократилось в среднем в 10 раз — значит, клиенты не тратят время впустую и не переживают из-за сбоев на серверах.

Однако практика показывает, что доступность систем 24/7 необязательна. Поэтому здесь у нас работает принцип бережливого производства: нет смысла тратить время на достижение слишком завышенной цели. Перепроизводство — скорее зло, чем благо.