Суп, от которого никто не откажется! Так мало кто готовит, а зря. Он настолько вкусный, что готовлю его хотя бы раз в неделю.
SRE — это не про инструменты. Это про страх. И как превратить его в систему
Ты думаешь, SRE — это когда ставишь Prometheus, Grafana, Alertmanager и называешь себя Site Reliability Engineer? Нет, дружище. SRE — это философия. И она начинается с одного чувства: СТРАХ. Страх, что: Хороший SRE не устраняет страх. Он строит систему, которая делает страх предсказуемым. Да, у тебя может быть: Но если ты не ответил на главные вопросы — инструменты ничего не спасут: → Это SLO (Service Level Objective).
Пример: «Мы обещаем 99.9% uptime в месяц = 43 минуты простоя в месяц — максимум»...