Найти тему
БИТ.CLOUD

Чек-лист: как подготовить ИТ инфраструктуру к новогодним праздникам

Новогодние праздники многократно увеличивают объемы трафика на веб-сайты и системы компаний. За несколько дней некоторые компании электронной коммерции и розничной торговли получают большую часть своего годового дохода. Однако даже крупные бренды имели свою долю простоев в праздничный сезон из-за различных сбоев и проблем. Несколько часов простоя в праздничные дни могут стоить организации большого объема недополученной прибыли. Как вы можете обеспечить хорошую подготовку своей ИТ-инфраструктуры к новогодним праздникам? Вот несколько советов:

  1. Мониторинг использования ресурсов и критических показателей с правильными пороговыми значениями и настроенными оповещениями. Просмотрите прошлые данные и оцените, достаточно ли ваших существующих ресурсов, чтобы справиться с дополнительным всплеском.
  2. Убедитесь, что ваша инфраструктура готова справляться с дополнительными нагрузками с помощью автоматического масштабирования и автоматической миграции. Наличие ваших систем в облаке с правильной конфигурацией очень полезно для масштабирования за пределами физических ограничений оборудования.
  3. Убедитесь, что на ваших кластерах и дисках хранилища достаточно свободного места и операций ввода-вывода в секунду для внезапного всплеска данных.
  4. Применяйте обновления и исправления заблаговременно, чтобы убедиться, что ваши системы стабильны. Это нужно сделать заблаговременно, чтобы избежать неожиданностей в последнюю минуту.
  5. Используйте кеш CDN – распределенный мониторинг времени безотказной работы с использованием глобальных узлов мониторинга. Для этого можно использовать различные инструменты, такие как Pingdom или AlertSite.
  6. Разнообразьте инфраструктуру локально и географически с помощью автоматических аварийных переключений.
  7. Убедитесь, что правила балансировки нагрузки и аварийного переключения реализованы должным образом и многократно протестированы.
  8. Убедитесь, что ваши базы данных настроены на автоматическое увеличение файлов данных.
  9. Убедитесь, что все операции передачи и синхронизации данных оптимизированы, включая репликацию базы данных и передачу файлов. При необходимости отключите нежелательные задания синхронизации/репликации данных, чтобы обеспечить полное использование пропускной способности для критически важных операций синхронизации.
  10. Внедряйте микросервисы и контейнерные приложения для повышения отказоустойчивости.
  11. Проведите нагрузочное и стресс-тестирование вашей инфраструктуры путем создания хаотичных ситуаций. Вы можете использовать данные за предыдущий год и прогнозируемый рост трафика, чтобы протестировать эти сценарии. Также важно провести нагрузочное и стресс-тестирование ваших планов отработки отказа и инфраструктуры резервного копирования.
  12. Настройте политики маршрутизации трафика, чтобы обеспечить отказоустойчивость сети. Заранее определите различные «узкие» места. Возможно, некоторые из ваших резервных копий не рассчитаны должным образом для обработки объемов в праздничный сезон, хотя они вполне способны обрабатывать трафик в обычное время.
  13. Имейте надлежащую команду специалистов, работающую круглосуточно и без выходных, графики дежурств по вызову и платформы реагирования на инциденты, такие как Pagerduty, VictorOps, Opsgenie. Очень часто вы не можете связаться с некоторыми из инженеров на месте во время праздников, поэтому наличие удаленных экспертов очень важно.
  14. Максимально оптимизируйте код. Медленный транзакционный код будет занимать больше времени из-за дополнительной нагрузки на серверы. Неоптимизированное задание создания отчетов будет выполняться часами, а не несколькими минутами. Даже некоторые отчеты и информационные панели очень важны для бизнеса во время праздничного сезона, поскольку компаниям нужно настроить и оптимизировать свои кампании продаж в соответствии с данными в режиме реального времени.
  15. Старайтесь избегать внесения непроверенных изменений в последнюю минуту. Важно иметь хорошо отработанный протокол и процедуру авторизации для внесения изменений в случае аварии или поломки.
  16. Протестируйте и подготовьте резервные ресурсы. Наличие резервных копий кода, конфигураций и данных важно для быстрого отката к предыдущим настройкам, если это необходимо.

Главный совет: помимо всего описанного выше подготовьте команду вашего центра управления безопасностью и постоянно контролируйте свои системы на предмет DDOS-атак, утечек данных, которые могут случайно произойти во время пикового трафика. Нет возможности самим заниматься всеми этим задачами? Не проблема! Избавьте себя от очередной головной боли и делегируйте задачи нашим специалистам по ИТ-аутсорсингу! Мы готовы администрировать вашу ИТ-инфраструктуру без отпуска и выходных.