«Я всего лишь перезапустил службу…» — и встал весь отдел. Знакомо? Рассказываю, как избежать типичных ошибок сисадмина при работе на живой системе. Любой сисадмин хоть раз сталкивался с этим сценарием:
всё работало, ты решил «слегка поправить», и вдруг — всё встало. Почта, 1С, доступы, VPN. Потом объяснения, почему и как, паника, звонки и срочный откат. А еще можно без премии остаться. На самом деле такие ситуации почти всегда можно было предотвратить. Нужно всего лишь чуть больше подготовки и привычки думать на шаг вперёд. Вот простой, но рабочий подход: чек-лист действий перед тем, как лезть в живую систему. 1. Сделай резервную копию — даже если это “мелочь” Что обычно происходит:
– "Я всего лишь правлю один конфиг."
– Через минуту — сервис не запускается.
– Через 10 минут — никто не может войти в систему. Что нужно делать: Почему:
Откат без копии — это не «откат», а «восстановление по памяти». А это дольше и больнее. 2. Проверь, что и кого это заденет Вопросы, которые нужно задать с