Чек-лист проверки сервера Windows - проверка нагрузки и настроек

104 прочитали

Проверяем текущие показатели

Если показатели выходят за пределы нормы, то, возможно, необходимо увеличить ресурсы сервера или поменять настройки.

1. Проверяем текущую нагрузку на оперативную память и процессор

Используем Task Manager (Диспетчер задач), либо Resource Monitor (Мониторинг в реальном времени).

Проверяем текущие показатели Если показатели выходят за пределы нормы, то, возможно, необходимо увеличить ресурсы сервера или поменять настройки. 1.

Запустите его (нажмите Ctrl+Alt+Delete) и посмотрите на параметры CPU Usage и MEM Usage. Вкладка Perfomance.

CPU должен держаться в районе 10%. В моменты пиковых значений может доходить до 50-60%. Если превышает 70%, то, значит, сервер не справляется с нагрузкой.

MEM Usage должен держаться в районе 30% от всего объёма для высоконагруженных серверов, возможно, 50% для слабонагруженных. Если показатель превышает 70%, то, значит, сервер не справляется с нагрузкой.

Если есть превышения показаний, то необходимо зайти в вкладку Processes и посмотреть какие процессы потребляют много ресурсов.

При любых отклонениях от нормы рекомендуем провести диагностику.

2. Проверяем свободное место на диске

Зайдите в My Computer и посмотрите количество свободного места на дисках. Должно быть не менее 25% (или 5 гигабайт) для серверов, работающих с 1С, CRM. Для веб-серверов также не менее 25% (или 1 гигабайта).

Проверяем текущие показатели Если показатели выходят за пределы нормы, то, возможно, необходимо увеличить ресурсы сервера или поменять настройки. 1.-2

3. Проверяем нагрузку на сетевой канал

Одной из причин медленной работы сервера может быть «забитый» сетевой канал.

Чтобы его проверить, надо использовать системный монитор (Монитор производительности или Performance Monitor).

В Windows Server 2012 запустить системный монитор можно из Диспетчера серверов (Server Manager) в меню «Средства» (Tools) — «Системный монитор» (Performance Monitor)

Проверяем текущие показатели Если показатели выходят за пределы нормы, то, возможно, необходимо увеличить ресурсы сервера или поменять настройки. 1.-3

Его интерфейс:

Проверяем текущие показатели Если показатели выходят за пределы нормы, то, возможно, необходимо увеличить ресурсы сервера или поменять настройки. 1.-4

В нем необходимо посмотреть использование сети. Если этот параметр больше 50%, то, значит, серверу может не хватать пропускной мощности сетевого канала.

4. Тестируем длину очереди и производительность жесткого диска

Можно оценить текущий уровень нагрузки на дисковую подсистему с помощью встроенных счетчиков производительности Windows из Performance Monitor.

https://winitpro.ru/index.php/2016/02/11/izmerenie-iops-diskovoj-podsistemy-s-pomoshhyu-powershell/ - здесь написано, как это сделать.

5. Тест Гилева (для серверов 1С)

  1. Пройдите тест Гилева.

http://www.gilev.ru/1c/tpc/tpc_gilv_for82.dt - для 8.2.

http://www.gilev.ru/1c/tpc/GILV_TPC_G1C_83.dt - для 8.3

Описывать тест в рамках чек-листа нецелесообразно. Поэтому ограничимся ссылками:

http://www.gilev.ru/tpc1cgilv/ - официальная страница теста

https://interface31.ru/tech_it/2021/12/kak-ustanovit-i-ispol-zovat-test-gileva-dlya-1spredpriyatie.html - подробная инструкция по прохождению.

6. Тест производительности базы данных

Тестируем SQL Server.

Определяем потребление памяти

Для начала нужно определить сколько памяти доступно SQL Server. Для этого запустите SSMS (SQL Server Management Studio), зайдите на сервер и зайдите в свойства сервера (ПКМ по названию сервера в Обозревателе объектов).

Проверяем текущие показатели Если показатели выходят за пределы нормы, то, возможно, необходимо увеличить ресурсы сервера или поменять настройки. 1.-5

Сам по себе доступный объём RAM вам ничего не скажет. Нужно сравнить это число с используемой памятью в Диспетчере Задач и самим движком SQL Server с помощью DMV.

В Диспетчере задач, во вкладке Подробности, найдите sqlservr.exe и посмотрите сколько оперативной памяти использует этот процесс.

  • Если на сервере, например, 128 GB оперативной памяти, а процесс sqlservr.exe использует 60 GB и ограничений по RAM у SQL Server нет, то оперативной памяти вам хватает.
  • Если SQL Server использует 80-90% RAM от заданной или максимальной, то в таком случае нужно смотреть DMV. Имейте в виду, что sqlservr.exe не сможет использовать всю оперативную память. Если на сервере 128 GB, то sqlservr.exe может использовать только 80-90% (100-110 GB), так как остальная память резервируется для операционной системы.

Смотри нагрузку на процессор

Нагрузку на процессор определить проще, так как это можно сделать в Диспетчере задач. Чтобы узнать текущую нагрузку на процессор, найдите в Диспетчере задач процесс sqlservr.exe

Проверяем текущие показатели Если показатели выходят за пределы нормы, то, возможно, необходимо увеличить ресурсы сервера или поменять настройки. 1.-6

Нагрузка в 30% и более на процессор от SQL Server говорит о большой загруженности.

Смотрим на загрузку дисков

Проверяем текущие показатели Если показатели выходят за пределы нормы, то, возможно, необходимо увеличить ресурсы сервера или поменять настройки. 1.-7

Нам нужна вкладка Disk. В секции Disk Activity отображаются файлы, к которым идёт обращение, и их скорость read/write на текущий момент. Отфильтруйте эту секцию по Total (кликните на Total). На самом верху будут файлы, которые на данный момент максимально используют диск. В случае с SQL Server это может быть полезно чтобы определить какая база больше всего нагружает диск на текущий момент.

В секции Storage отображаются все диски в системе. В этой секции нам нужны 2 параметра – Active Time и Disk Queue. Active Time в процентах отображает нагрузку на диск, то есть если вы видите на диске C:\ Active Time равный 90, это значит что ресурс чтения/записи диска на текущий момент используется на 90%. Столбец Disk Queue отображает очередь обращений к диску, и если значение очереди не равно нулю, то диск загружен на 100% и не справляется с нагрузкой. Так же если Active Time близок к 100, то диск используется практически на пределе своих возможностей по скорости.

Сбор данных в течение длительного времени

Необходимо собрать данные на протяжении длительного времени, чтобы убедится, что серверу хватает ресурсов во время пиковых нагрузок.

Рекомендуем использовать Performance Monitor (Системный монитор или Монитор производительности) для сбора данных.

1. Откройте Системный монитор и добавьте счетчик

2. Выберите «Память» в категории, а затем «Доступная память МБ» и «Общий объём страниц файла МБ» в списке лекарств дисплей.

3. Нажмите «Добавить» и закройте окно окна.

4. Периодически проверяйте Монитор для отслеживания использования ресурсов на сервере.

https://onecomp.ru/monitoring-resursov-windows-server-2012/ - инструкция по работе с Performance Monitor.

Собирайте значения в течение не менее 1 суток (а лучше недели). Затем сделайте аналитику:

· Если CPU Usage стабильно в течение суток превышает значение 50%, то серверу явно не хватает ресурсов.

· Если MEM Usage часто превышает значение в 50% в течение суток, то сервер близок к перегрузке. Если есть значения выше 70%, то серверу уже не хватает ресурсов.

· Если в некоторые моменты сетевой канал «забивается» на более чем 80%, то его необходимо расширять.

· Оцените производительность жесткого диска – время для выполнения одной операции не должно быть выше 25 мс (для высоконагруженных серверов – 10 мс)

Обычно счетчики perfmon обрабатывают с помощью других систем мониторинга, например, Zabbix, так как в perfmon неудобно хранить и смотреть данные за прошедшее время.

Настройку мониторинга системы и слежение за показателями лучше доверить компетентную специалисту.

При любых отклонениях советуем провести диагностику вашего сервера!

Тест сервера на распространенные ошибки

1. Программная часть регулярно обновляется? Наличие обновлений проверяются вручную?

Для корректной работы сервера обновления очень важны (убирают «дыры» в безопасности, устраняют различные ошибки в работе). Автоматические обновления не всегда устанавливаются, поэтому необходимо время от времени проверять вручную.

2. Если сервер используется для 1С, то папки с базами данных добавлены в исключения для антивируса?

Регулярная проверка баз данных 1С антивирусом будет сильно нагружать сервер.

3. Выполняется плановое сканирование сервера на вирусы?

Это позволяет обнаружить проникновение злоумышленников.

4. Резервное копирование корректно работает? Периодически проверяете создание резервных копий?

Сбои происходят везде, даже в системе резервного копирования. Чтобы точно знать, что в запасе есть рабочая копия, регулярно проверяйте, делаются ли копии, правильно ли сохраняются, в нужном ли объеме.

5. Резервные копии хранятся в облаке или другом сервере?

Если резервные копии данных хранятся не отдельно от основных данных, то при полной потери сервере не получится ничего восстановить.

6. Кто-то регулярно просматривает ошибки по журналу логов?

Без мониторинга журнала логов можно даже не узнать о наличии каких-то проблем.

Нужно просматривать логи Windows, баз данных, 1С в режиме отладчика.

7. Действует служба мониторинга сервера?

Без службы мониторинга можно даже не знать, что временами сервер «падает». Например, при создании «бекапов».

8. Все используемые порты закрыты?

Все неиспользуемые порты надо закрыть. Для поиска лишних портов используйте команду netstat:

1) netstat -a: отображает все существующие соединения и открытые порты;

2) netstat -n: именует порты в цифровом формате;

3) netstat -o: отображает связанный процесс для каждого открытого порта.

Закрывать порты надо в Firewall.

9. На сервере настроено правильное время?

В целях безопасности, таких как правильная работа двухфакторной аутентификации и правильной работы журналов, служб, отдельных программ на Windows Server — нужно, чтобы время на всех серверах совпадало и было верным по часовому поясу.

10. Все неиспользуемые сервисы и службы выключены?

Активные неиспользуемые сервисы забирают ресурсы сервера, повышают вероятность взлома.

11. Включен Брандмауэр Windows и настроена локальная политика безопасности?

Необходимо настроить политику паролей (время действия, минимальная длина), блокировку учетных записей (условно, после 3 неправильных попыток входа), параметры ведения журнала.

Если вы хотите получить полноценный IT-аудит с разбором состояния вашей инфраструктуры и нашими рекомендациями, то запишитесь на бесплатную диагностическую встречу по ссылке https://ininsys.ru/audit-it-infrastruktury/.