Новогодние праздники многократно увеличивают объемы трафика на веб-сайты и системы компаний. За несколько дней некоторые компании электронной коммерции и розничной торговли получают большую часть своего годового дохода. Однако даже крупные бренды имели свою долю простоев в праздничный сезон из-за различных сбоев и проблем. Несколько часов простоя в праздничные дни могут стоить организации большого объема недополученной прибыли. Как вы можете обеспечить хорошую подготовку своей ИТ-инфраструктуры к новогодним праздникам? Вот несколько советов:
- Мониторинг использования ресурсов и критических показателей с правильными пороговыми значениями и настроенными оповещениями. Просмотрите прошлые данные и оцените, достаточно ли ваших существующих ресурсов, чтобы справиться с дополнительным всплеском.
- Убедитесь, что ваша инфраструктура готова справляться с дополнительными нагрузками с помощью автоматического масштабирования и автоматической миграции. Наличие ваших систем в облаке с правильной конфигурацией очень полезно для масштабирования за пределами физических ограничений оборудования.
- Убедитесь, что на ваших кластерах и дисках хранилища достаточно свободного места и операций ввода-вывода в секунду для внезапного всплеска данных.
- Применяйте обновления и исправления заблаговременно, чтобы убедиться, что ваши системы стабильны. Это нужно сделать заблаговременно, чтобы избежать неожиданностей в последнюю минуту.
- Используйте кеш CDN – распределенный мониторинг времени безотказной работы с использованием глобальных узлов мониторинга. Для этого можно использовать различные инструменты, такие как Pingdom или AlertSite.
- Разнообразьте инфраструктуру локально и географически с помощью автоматических аварийных переключений.
- Убедитесь, что правила балансировки нагрузки и аварийного переключения реализованы должным образом и многократно протестированы.
- Убедитесь, что ваши базы данных настроены на автоматическое увеличение файлов данных.
- Убедитесь, что все операции передачи и синхронизации данных оптимизированы, включая репликацию базы данных и передачу файлов. При необходимости отключите нежелательные задания синхронизации/репликации данных, чтобы обеспечить полное использование пропускной способности для критически важных операций синхронизации.
- Внедряйте микросервисы и контейнерные приложения для повышения отказоустойчивости.
- Проведите нагрузочное и стресс-тестирование вашей инфраструктуры путем создания хаотичных ситуаций. Вы можете использовать данные за предыдущий год и прогнозируемый рост трафика, чтобы протестировать эти сценарии. Также важно провести нагрузочное и стресс-тестирование ваших планов отработки отказа и инфраструктуры резервного копирования.
- Настройте политики маршрутизации трафика, чтобы обеспечить отказоустойчивость сети. Заранее определите различные «узкие» места. Возможно, некоторые из ваших резервных копий не рассчитаны должным образом для обработки объемов в праздничный сезон, хотя они вполне способны обрабатывать трафик в обычное время.
- Имейте надлежащую команду специалистов, работающую круглосуточно и без выходных, графики дежурств по вызову и платформы реагирования на инциденты, такие как Pagerduty, VictorOps, Opsgenie. Очень часто вы не можете связаться с некоторыми из инженеров на месте во время праздников, поэтому наличие удаленных экспертов очень важно.
- Максимально оптимизируйте код. Медленный транзакционный код будет занимать больше времени из-за дополнительной нагрузки на серверы. Неоптимизированное задание создания отчетов будет выполняться часами, а не несколькими минутами. Даже некоторые отчеты и информационные панели очень важны для бизнеса во время праздничного сезона, поскольку компаниям нужно настроить и оптимизировать свои кампании продаж в соответствии с данными в режиме реального времени.
- Старайтесь избегать внесения непроверенных изменений в последнюю минуту. Важно иметь хорошо отработанный протокол и процедуру авторизации для внесения изменений в случае аварии или поломки.
- Протестируйте и подготовьте резервные ресурсы. Наличие резервных копий кода, конфигураций и данных важно для быстрого отката к предыдущим настройкам, если это необходимо.
Главный совет: помимо всего описанного выше подготовьте команду вашего центра управления безопасностью и постоянно контролируйте свои системы на предмет DDOS-атак, утечек данных, которые могут случайно произойти во время пикового трафика. Нет возможности самим заниматься всеми этим задачами? Не проблема! Избавьте себя от очередной головной боли и делегируйте задачи нашим специалистам по ИТ-аутсорсингу! Мы готовы администрировать вашу ИТ-инфраструктуру без отпуска и выходных.