Добавить в корзинуПозвонить
Найти в Дзене
ЗАКРОМА

Зачем компаниям делать бэкап S3, если он и так «надёжный»

Российский рынок хранения данных сейчас переживает довольно интересный период, который со стороны выглядит как массовая перестройка, а изнутри как постоянный поиск баланса между технологиями, требованиями и здравым смыслом, потому что компании активно переходят на S3-совместимые хранилища и начинают использовать их не просто как место, куда складывать файлы, а как фундамент для всей своей IT-инфраструктуры. В этот момент происходит любопытная вещь: почти каждый заказчик, независимо от отрасли и уровня зрелости, рано или поздно задаёт один и тот же вопрос, который сначала немного сбивает с толку, а потом начинает звучать абсолютно закономерно: «а как нам делать бэкап S3?» На первый взгляд этот вопрос действительно кажется странным, потому что сама идея S3-хранилищ исторически строилась вокруг того, что дополнительное резервное копирование им просто не нужно, ведь внутри уже заложены механизмы надёжности, которые должны защищать данные практически от любых сценариев, и многие зарубежные

Российский рынок хранения данных сейчас переживает довольно интересный период, который со стороны выглядит как массовая перестройка, а изнутри как постоянный поиск баланса между технологиями, требованиями и здравым смыслом, потому что компании активно переходят на S3-совместимые хранилища и начинают использовать их не просто как место, куда складывать файлы, а как фундамент для всей своей IT-инфраструктуры.

В этот момент происходит любопытная вещь: почти каждый заказчик, независимо от отрасли и уровня зрелости, рано или поздно задаёт один и тот же вопрос, который сначала немного сбивает с толку, а потом начинает звучать абсолютно закономерно: «а как нам делать бэкап S3?»

На первый взгляд этот вопрос действительно кажется странным, потому что сама идея S3-хранилищ исторически строилась вокруг того, что дополнительное резервное копирование им просто не нужно, ведь внутри уже заложены механизмы надёжности, которые должны защищать данные практически от любых сценариев, и многие зарубежные решения прямо транслируют эту мысль: S3 и есть ваш бэкап, дополнительный уровень защиты не требуется.

Но, как это часто бывает, реальная практика оказалась чуть сложнее и намного интереснее, особенно если смотреть на неё через призму российского рынка, где требования к данным формируются не только технологиями, но и требованиями, внутренними процессами и, если честно, вполне здоровым желанием бизнеса «держать всё под контролем».

Чтобы понять, где возникает расхождение, нужно сначала коротко разобраться, за счёт чего S3 вообще считается надёжным, потому что там действительно всё сделано довольно продуманно: данные разбиваются на части и распределяются по разным дискам таким образом, чтобы потеря нескольких из них не приводила к потере информации, дополнительно используется репликация, то есть хранение данных в нескольких копиях внутри системы, а при необходимости всё это можно развернуть сразу в нескольких дата-центрах, чтобы обеспечить защиту даже от серьёзных аварий на уровне площадки.

Звучит как идеальная система, и в какой-то степени это действительно так, поэтому многие западные вендоры даже не пытаются добавить в свои решения классические механизмы резервного копирования, считая их избыточными и устаревшими.

На российском рынке эта логика довольно быстро начинает давать сбой, и происходит это по двум причинам, которые вместе формируют совершенно другой подход к работе с данными.

Первая причина связана с требованиями регуляторов, которые в ряде отраслей не просто рекомендуют, а прямо требуют наличия резервных копий, причём не внутри той же самой системы, а в виде отдельных, физически изолированных копий, которые можно хранить на других носителях, будь то отдельные диски, ленточные библиотеки или изолированные хранилища, и это правило действует независимо от того, насколько надёжной считается основная инфраструктура.

Если говорить проще, регулятору недостаточно того, что «система сама себя защищает», ему важно, чтобы существовала вторая, независимая копия данных, до которой нельзя дотянуться из основной системы, потому что именно она считается последней линией защиты в случае серьёзных инцидентов.

Особенно жёстко это проявляется в банковском секторе, промышленности и компаниях, работающих с критической информационной инфраструктурой, где требования к безопасности данных формируются не только внутренними стандартами, но и внешними аудитами, и там отсутствие отчуждаемой копии может просто означать, что система не проходит сертификацию, как бы хорошо она ни была устроена технически.

Вторая причина уже не про формальные требования, а про реальный опыт и довольно понятную логику бизнеса, потому что за последние годы рынок увидел достаточно инцидентов, чтобы перестать безоговорочно верить в «абсолютную надёжность» любой системы, какой бы продвинутой она ни была.

Один из показательных случаев произошёл с крупной транспортной компанией, чьи системы ежедневно обрабатывали огромные объёмы операций, и в какой-то момент она столкнулась с масштабной кибератакой, в результате которой за считанные часы была выведена из строя значительная часть инфраструктуры, включая серверы, виртуальные среды и ключевые сервисы, без которых бизнес фактически остановился.

И здесь начинается важный поворот, потому что, несмотря на разрушение основной системы, у компании существовала отдельная, изолированная стратегия резервного копирования, и именно эти копии, которые не были затронуты атакой, позволили начать восстановление практически сразу, а через несколько дней вернуть в работу ключевые процессы, существенно снизив потенциальные потери, которые в противном случае могли бы измеряться совсем другими цифрами.

После таких историй отношение к бэкапам меняется довольно быстро, потому что становится очевидно, что даже самая надёжная система не защищает от всех сценариев, особенно если речь идёт о логических ошибках, ошибках доступа или целенаправленных атаках, и в этот момент появляется простая мысль: «хорошо, что у нас есть ещё одна копия, до которой никто не добрался».

И тут важно развести два понятия, которые часто путают, особенно когда речь заходит про S3, потому что внутри таких систем действительно есть механизмы, которые на первый взгляд выглядят как бэкап, но по сути им не являются.

Например, в S3 можно включить версионирование, и тогда система будет хранить предыдущие версии файлов, позволяя откатиться к ним в случае ошибки, но при этом все эти версии продолжают находиться внутри той же самой системы, а значит, в случае её компрометации они могут пострадать вместе с основной копией.

Похожая история с репликацией, которая создаёт дубли данных, но делает это либо внутри одного кластера, либо между связанными системами, не создавая по-настоящему независимой копии, которая могла бы существовать отдельно и быть недоступной для тех же рисков.

Именно поэтому бэкап остаётся отдельной дисциплиной, несмотря на все встроенные механизмы надёжности, потому что его задача — не просто сохранить данные, а сделать это так, чтобы копия могла пережить даже полный отказ или компрометацию основной системы.

Когда разговор доходит до практической реализации, возникает ещё один нюанс, который редко обсуждают вне профессионального круга, но который становится критичным на больших объёмах данных, и связан он с тем, как именно делать резервное копирование, потому что копировать сотни терабайт или петабайты данных целиком каждый день — это долго, дорого и, если честно, довольно болезненно для инфраструктуры.

Здесь на сцену выходит так называемый инкрементальный бэкап, который вместо копирования всего объёма данных каждый раз сохраняет только те изменения, которые произошли с момента предыдущего бэкапа, позволяя существенно сократить время и объём операций, но в случае с S3 возникает неожиданная сложность, потому что стандартный протокол не предусматривает удобного способа узнать, какие именно объекты изменились за определённый период времени.

В результате получается почти комичная ситуация, когда современная система хранения, рассчитанная на огромные объёмы данных и сложные сценарии использования, формально не умеет делать одну из базовых вещей, к которым привык корпоративный мир, и поэтому большинство производителей просто обходят эту тему стороной, не предлагая полноценной реализации инкрементального бэкапа.

Здесь начинается та самая адаптация под реальность, которая сейчас активно происходит на российском рынке, потому что разработчики вынуждены учитывать не только спецификацию технологии, но и реальные запросы бизнеса, регуляторов и практики эксплуатации, и в некоторых случаях это приводит к появлению функциональности, которой изначально в S3 просто не было.

Например, появляются механизмы, позволяющие отслеживать изменения данных и строить на их основе инкрементальные бэкапы, причём делать это эффективно даже на больших объёмах, не перегружая систему и не превращая процесс в многочасовую операцию, что в свою очередь позволяет компаниям использовать привычные схемы резервного копирования, сочетая полные и добавочные копии и укладываясь в разумные окна времени.

В этот момент происходит некий сдвиг, в котором S3 перестаёт быть просто «надёжным хранилищем» и становится полноценной частью корпоративной инфраструктуры, которая соответствует не только техническим требованиям, но и реальным процессам бизнеса, включая аудит, безопасность и управление рисками.

В конечном счёте вся эта история сводится к довольно простому, но важному выводу: надёжность системы и наличие резервной копии — это не одно и то же, и попытка заменить одно другим почти всегда заканчивается неприятными открытиями в самый неподходящий момент.

Поэтому вопрос «зачем делать бэкап, если S3 и так надёжный» на практике превращается в другой: «что будет, если надёжная система всё-таки даст сбой, и готовы ли мы к этому сценарию», и именно ответ на него определяет, насколько спокойно бизнес переживёт следующий инцидент, когда он неизбежно случится.