运维值班路线¶

这条路线适合值班、应急响应和线上故障初查。核心原则是先保留现场，再做低风险判断，最后按影响面执行修复。

排查顺序¶

现象	优先文档
机器变慢、CPU 高	CPU 飙高排查、Linux 性能调优
磁盘写入失败	磁盘空间满排查、Linux 磁盘与 LVM
服务起不来	systemd 服务启动失败、端口被占用
页面 502/504	Nginx 502/504 排查、云负载均衡排查
SSH 登录失败	SSH 连接失败排查、Linux 网络排查
监控无数据	Prometheus Target Down、Grafana 无数据

hostname
uptime
date
df -h
free -h
ss -tulnp
journalctl -p err -n 50 --no-pager