Когда дашборды уже не помогают - ты идёшь в ОС. Вот 10 команд, которые реально используют в продакшн-инцидентах: 1. strace -p <PID> -c → трассирует системные вызовы процесса и показывает, на чём он завис 2. perf top -p <PID> → live-профилирование CPU, сразу видно “горячие” функции 3. tcpdump -i eth0 -w capture.pcap port 8080 → захват сетевого трафика для глубокого анализа 4. ab -n 10000 -c 100 http://localhost/ → быстрый нагрузочный тест: 10k запросов, 100 одновременно 5. kubectl debug node/node1 -it --image=busybox → подключение к ноде через временный контейнер 6. dmesg -T | grep -i 'oom' → проверка OOM kill событий ядра 7. lsof -i :8080 → какой процесс занял порт 8. iostat -xz 1 5 → статистика диска в реальном времени 9. vmstat -w 1 5 → память, swap и CPU в динамике 10. kubectl debug pod/app -it --copy-to=debug-pod --image=nicolaka/netshoot → глубокая диагностика сети внутри кластера Когда всё горит - именно эти команды спасают. Сохрани перед следующи
🔥 Linux Performance & Deep Debugging команды, которые должен знать каждый DevOps-инженер
23 марта23 мар
22
~1 мин