Приветствую всех, кто интересуется IT и хочет узнать больше о ключевых аспектах поддержания работоспособности сложных систем. Сегодня мы поговорим о SRE, или Site Reliability Engineering, и о том, почему инженеры этого направления являются настоящими героями в мире IT. Термин SRE хоть и зародился по мотивам разработки ПО, но как я вижу он совершенно точно подходит и к нашей специфике работы ИТ аутсорсинга. У нас персонал разделён также на три категории Ops (они же операторы, они же 1-я линия поддержки, они же младший персонал), за ними есть точно такие же DevOps (программист + оператор)...
В настоящее время подразделение по обеспечению надежности объектов (SRE) стало одним из основных участников современных и быстро развивающихся отраслей. Обычно это момент, когда требование безупречной поставки программного обеспечения пересекается с требованием надежности, обеспечивая хрупкий баланс. Это не просто роль. Это запланированная позиция, направленная на поддержание работоспособности системы и намеренное устранение финансовых недостатков, связанных с простоями. Согласно последнему опросу, проведенному Catchpoint, более 54% организаций уже практикуют и применяют методы SRE...