Добавить в корзинуПозвонить
Найти в Дзене

Радио «Виктор»: толерантность к плохому

Радио «Виктор»: толерантность к плохому Есть тенденция, которая убивает команды и процессы не громко, а почти незаметно. Это рост толерантности к плохому. Сначала — мелочь: ну не проверили новый эндпоинт перед выкладкой, ничего страшного, ведь маленький кусочек, да и прокатило. Потом — баг, но «не страшный», и всё равно через неделю новый релиз, никто не заметит. В какой-то момент ловите себя на том, что «катим всё, что катится». А дальше — точка невозврата. И проблема даже не в баге или качестве кода, а в том, что команда уже не чувствует, что хорошо, а что плохо. Привыкла. Когда-то у моей команды начал подвисать коннект к базе. В первый раз порестартили — полечилось. Не успел я оглянуться, как оказалось, что инженер уже рестартит дважды в день — я же в первый раз разрешил. Потом кто-то поставил автоматический роллинг-рестарт каждые 10 минут — и проблема как будто исчезла. До тех пор, пока сервис не встал «колом». Задним умом легко сказать, что нужен был хороший постмортем. И я, кон

Радио «Виктор»: толерантность к плохому

Есть тенденция, которая убивает команды и процессы не громко, а почти незаметно. Это рост толерантности к плохому.

Сначала — мелочь: ну не проверили новый эндпоинт перед выкладкой, ничего страшного, ведь маленький кусочек, да и прокатило. Потом — баг, но «не страшный», и всё равно через неделю новый релиз, никто не заметит. В какой-то момент ловите себя на том, что «катим всё, что катится». А дальше — точка невозврата. И проблема даже не в баге или качестве кода, а в том, что команда уже не чувствует, что хорошо, а что плохо. Привыкла.

Когда-то у моей команды начал подвисать коннект к базе. В первый раз порестартили — полечилось. Не успел я оглянуться, как оказалось, что инженер уже рестартит дважды в день — я же в первый раз разрешил. Потом кто-то поставил автоматический роллинг-рестарт каждые 10 минут — и проблема как будто исчезла. До тех пор, пока сервис не встал «колом». Задним умом легко сказать, что нужен был хороший постмортем. И я, конечно, всегда стараюсь так и делать, но вот один раз не уследил — и понеслось.

Дело не в техдолге

Как-то я принял под руководство команду, где проходили ежедневные стендапы по полтора часа. Никто не возмущался. На личных встречах коллеги говорили, что «не хватает времени на проекты». Но никто не обсуждал конкретно эти встречи. Они были как само собой разумеющееся.

Потому что когда-то это были «пятиминутки». Потом стали закапываться глубже. Потом — ещё и ещё. И вот ты уже часами висишь на дейлике, но тебе кажется, что так и надо. А мне, как внешнему наблюдателю, это бросилось в глаза сразу же.

Мы редко замечаем деградацию процесса, если она происходит по миллиметру. Особенно если мы в этом процессе живём каждый день.

Что с этим делать?

У меня нет универсального рецепта, но есть один принцип, который помогает: нулевая терпимость к тому, что вам кажется плохим. Вот как только заметили, что что-то явно не так — сразу, на месте, разобраться с этим. В моём примере с сервисом и базой мне стоило остановить этот снежный ком в момент, когда только появились сомнения. Я тогда был зелёный и что-то стал подозревать только в момент, когда эти перезапуски уже стали регулярными. Сейчас я бы остановил это сразу: помог перезапуск? Хорошо. А теперь разбираемся — почему и как не допустить.

А что в перспективе?

Когда вы вырастаете как команда, как инженер, как руководитель — ваши стандарты тоже должны вырасти. И то, что вчера казалось «ну нормально же», сегодня — уже плохая практика. Когда-то мне было «норм» работать в команде без процессов CI/CD. Сейчас, если я приду в такую, то сразу обращу внимание на ручную выкатку.

Это не значит, что нужно рубить с плеча. Но значит, что если ручной деплой — пока неизбежность, то каждый такой процесс:

– должен быть видим,

– должен быть обсуждён,

– должен иметь план ликвидации,

– и его нельзя маскировать под норму.

Если не проводить такую переоценку регулярно, можно оказаться в точке, где всё плохо, но никого это уже не беспокоит. Потому что «всегда же так было».

Вывод

Толерантность к плохому растёт как сорняк — медленно, но верно. Заметить это изнутри сложно. Но можно: если на регулярной основе пересматривать, что считается «нормой». И если ошибку не оправдывать привычкой, а разбирать. Даже маленькое «ну ладно, сойдёт» может стать началом плохого сценария.