Найти в Дзене

Как обеспечить эффективное и надёжное резервное копирование?

Наша система резервного копирования успешно работает более 15 лет, неоднократно доказывая свою эффективность. Она позволяет оперативно восстанавливать данные после технических сбоев или человеческих ошибок. 1. Февраль 2023 Сервер в дата-центре Хесснера (Германия) вышел из строя. На нём хранилось 2 ТБ критически важных данных: архивы проектов, dev-серверы, резервные копии, git-репозитории (вся история изменений за 10+ лет), задачи и обсуждения из Jira. Итог: Благодаря резервному копированию 80–90% инфраструктуры восстановили за 2 дня, остальное — в течение недели. 2. Февраль 2025 Сервер клиентского проекта перестал отображаться в панели хостинга, консоль не работала. Поддержка восстанавливала данные почти 24 часа. Итог: Данные восстановлены, бэкап сработал. Тогда это казалось единичным случаем. 3. Март 2025 В другом проекте база данных стала недоступна, а восстановить её было некуда. Итог: Потеря дня на восстановление + два дня утраченных данных. Клиент недополучил сотни заказов с марке
Оглавление

Современный бизнес нуждается в надёжной защите данных и бесперебойности процессов. Основа такой защиты — грамотно выстроенная система резервного копирования.

Наша система резервного копирования успешно работает более 15 лет, неоднократно доказывая свою эффективность. Она позволяет оперативно восстанавливать данные после технических сбоев или человеческих ошибок.

Однако в 2025 году мы столкнулись с рядом инцидентов, выявивших слабые места и необходимость модернизации.

1. Февраль 2023

Сервер в дата-центре Хесснера (Германия) вышел из строя. На нём хранилось 2 ТБ критически важных данных: архивы проектов, dev-серверы, резервные копии, git-репозитории (вся история изменений за 10+ лет), задачи и обсуждения из Jira.

Итог:

Благодаря резервному копированию 80–90% инфраструктуры восстановили за 2 дня, остальное — в течение недели.

2. Февраль 2025

Сервер клиентского проекта перестал отображаться в панели хостинга, консоль не работала. Поддержка восстанавливала данные почти 24 часа.

Итог:

Данные восстановлены, бэкап сработал. Тогда это казалось единичным случаем.

3. Март 2025

В другом проекте база данных стала недоступна, а восстановить её было некуда.

Итог:

Потеря дня на восстановление + два дня утраченных данных. Клиент недополучил сотни заказов с маркетплейсов, так как система интегрировала их с 1С-Битрикс.

Вывод:

Даже суточная потеря данных критична. Нужны более частые и актуальные копии.

Новая многоуровневая система резервного копирования

Учтённые ошибки помогли создать усовершенствованную систему:

1. Частота копирования

- Полный бэкап (ядро + БД) — ежедневно.

- Копия БД (без временных таблиц) — каждые 3 часа.

- Медиафайлы — раз в неделю (отдельным потоком, объёмы до сотен ГБ).

- Хранение локально в папке backup внутри Bitrix (работаем только с 1С-Битрикс).

2. Автоматизация

Утром transfer-сервер забирает свежие копии с клиентских серверов.

3. Геораспределённое хранение (5 локаций)

- Основной BackUp-сервер в дата-центре.

- Облачное хранилище (синхронизируется с BackUp-сервером).

- Физический сервер с RAID-массивом (дублирует данные).

- Новое: S3-хранилище в другом дата-центре (изначально по запросу клиента, теперь — стандарт).

- Локальная копия у клиента.

4. Снимки серверов (snapshots)

- Полный образ сервера с ОС — раз в неделю.

- Хранение данных за последние 15 дней (дольше неактуально).

5. Контроль версий через Git

- Весь код (включая ядро 1С-Битрикс) в Git с историей изменений за 15+ лет.

- Дополнительно: проект можно выгрузить на USB-накопитель на случай полного отказа сети.

Рекомендации по настройке

1. Частота копирования

- Низкая активность: раз в неделю.

- Средние проекты: ежедневно.

- Высокая нагрузка: каждые 3 часа (минимизация потерь заказов и транзакций).

2. Разделение потоков

- База данных, медиафайлы и системные компоненты — отдельные потоки. Это ускоряет восстановление.

3. Геораспределение

5 независимых площадок:

- Облако (основное хранилище).

- Физические серверы (доп. защита).

- Дата-центры (территориальная избыточность).

4. Дополнительные меры

- Хранение критичных данных в S3-облаках.

- Регулярные снимки серверов (snapshots) для быстрого восстановления.

Итоги

Соблюдение этих принципов позволяет:

- Свести к минимуму потери при сбоях.

- Обеспечить непрерывность бизнес-процессов.

- Гарантировать защиту данных на всех уровнях.