В какой-то момент почти в любой инфраструктуре появляются серверы, к которым относятся по-особенному.
Они:
- настраивались вручную
- дорабатывались со временем
- «чуть отличаются от остальных»
И про них обычно говорят:
«Только его не трогай, там всё настроено»
Так появляются так называемые pet-серверы.
Что такое “pet-сервер”
Если упростить, это сервер, который:
- уникален
- не воспроизводим
- имеет историю «ручных изменений»
- понятен только тем, кто с ним работал
Он не плохой и не хороший.
Он просто особенный.
Почему они появляются
Причины почти всегда одни и те же:
- быстрые решения «на сейчас»
- ручные доработки
- отсутствие стандартов
- нехватка времени на приведение к общему виду
В моменте это кажется нормальным.
Проблема в том, что таких серверов со временем становится больше.
В чём проблема на практике
Проблемы начинаются не сразу.
А потом:
- изменения делать страшно
- никто не уверен, что произойдёт
- автоматизация не работает
- документация не соответствует реальности
И появляется зависимость:
«Это трогать может только один человек»
Почему это мешает автоматизации
Автоматизация предполагает, что система предсказуема.
Но если каждый сервер уникален:
- невозможно написать универсальные сценарии
- появляется множество исключений
- растёт сложность
- увеличивается риск ошибок
В какой-то момент проще сделать руками, чем «учесть всё».
Почему это опасно даже в маленькой инфраструктуре
Есть ощущение, что это проблема больших систем.
На практике — наоборот.
В небольшой инфраструктуре:
- меньше людей
- меньше времени
- меньше подстраховки
И один такой сервер может стать точкой риска для всей системы.
Почему от них сложно избавиться
Самое интересное — избавиться от pet-серверов сложнее, чем их создать.
Потому что:
- никто не уверен, как он устроен полностью
- нет полной картины изменений
- страшно «сломать то, что работает»
И они продолжают жить годами.
Что с этим делать
Нет одного простого решения.
Но есть направление:
- стремиться к воспроизводимости
- минимизировать ручные изменения
- фиксировать базовое состояние
- постепенно приводить системы к общему виду
Важно не «переписать всё сразу»,
а двигаться к предсказуемости.
Проблема не в самих серверах.
Проблема в том, что инфраструктура становится:
- непредсказуемой
- зависимой от людей
- сложной в сопровождении
Автоматизация в такой среде не работает.
Потому что автоматизировать можно только то,
что можно воспроизвести.