导读 | Linux 服务器我们天天打交道,特别是 Linux 工程师更是如此。为了保证服务器的安全与性能,我们经常需要监控服务器的一些状态,以保证工作能顺利开展。 |
本文介绍的几个命令,不仅仅适用于服务器监控,也适用于我们日常情况下的开发。
watch 命令我们的使用频率很高,它的基本作用是,按照指定频率重复执行某一条指令。使用这个命令,我们可以重复调用一些命令来达到监控服务器的作用。
默认情况下,watch 命令的执行周期是 2 秒,但我们可以使用 -n 选项来指定运行频率,比如我们想要每隔 5 秒执行 date 命令,可以这么执行:
$?watch?-n?5?date
一台服务器肯定有多人在用,特别是本部门的小伙伴。对于这些小伙伴有没浑水摸鱼,我们可以使用一些命令来监控他们。
我们可以每隔 10 秒执行 who 命令,来看看都有谁在使用服务器。
$?watch?-n?10?who Every?10.0s:?who?????????????????????????????butterfly:?Tue?Jan?23?16:02:03?2019 shs??????:0???????????2019-01-23?09:45?(:0) dory?????pts/0????????2019-01-23?15:50?(192.168.0.5) alvin?????pts/1????????2019-01-23?16:01?(192.168.0.15) shark????pts/3????????2019-01-23?11:11?(192.168.0.27)
如果发现系统运行很慢,我们可以调用 uptime 命令来查看系统平均负载情况。
$?watch?uptime Every?2.0s:?uptime???????????????????????????butterfly:?Tue?Jan?23?16:25:48?2019 16:25:48?up?22?days,??4:38,??3?users,??load?average:?1.15,?0.89,?1.02
一些关键的进程肯定不能挂,否则可能会影响到业务开展,所以我们可以重复统计服务器中的所有进程数量。
$?watch?-n?5?'ps?-ef?|?wc?-l' Every?5.0s:?ps?-ef?|?wc?-l???????????????????butterfly:?Tue?Jan?23?16:11:54?2019 245
想动态知道服务器内存使用情况,可以重复执行 free 命令。
$?watch?-n?5?free?-m Every?5.0s:?free?-m??????????????????????????butterfly:?Tue?Jan?23?16:34:09?2019 total????????used????????free??????shared??buff/cache???available Mem:???????????5959?????????776????????3276??????????12????????1906????????4878 Swap:??????????2047???????????0????????2047
当然不仅仅是这些,我们还可以重复调用很多命令来对服务器一些关键参数进行监控,
使用 top 命令我们可以知道系统的很多关键参数,而且是动态更新的。默认情况下,top 监控的是系统的整体状态,如果我们只想知道某个人的使用情况,可以使用 -u 选项来指定这个人。
$?top?-u?alvin top?-?16:14:33?up?2?days,??4:27,??3?users,??load?average:?0.00,?0.01,?0.02 Tasks:?199?total,???1?running,?198?sleeping,???0?stopped,???0?zombie %Cpu(s):??0.0?us,??0.2?sy,??0.0?ni,?99.8?id,??0.0?wa,??0.0?hi,??0.0?si,??0.0?st MiB?Mem?:???5959.4?total,???3277.3?free,????776.4?used,???1905.8?buff/cache MiB?Swap:???2048.0?total,???2048.0?free,??????0.0?used.???4878.4?avail?Mem ? PID?USER??????PR??NI????VIRT????RES????SHR?S??%CPU??%MEM?????TIME+?COMMAND 23026?alvin??????20???0???46340???7820???6504?S???0.0???0.1???0:00.05?systemd 23033?alvin??????20???0??149660???3140?????72?S???0.0???0.1???0:00.00?(sd-pam) 23125?alvin??????20???0???63396???5100???4092?S???0.0???0.1???0:00.00?sshd 23128?alvin??????20???0???16836???5636???4284?S???0.0???0.1???0:00.03?zsh
在这个结果里,你不仅仅可以看到 alvin 这个用户运行的所有的进程数,也可以看到每个进程所消耗的系统资源(CPU,内存),同时依然可以看到整个系统的关键参数。
如果你想知道每个用户登录服务器所使用的时间,你可以使用 ac 命令。这个命令需要你安装 acct 包(Debian)或 psacct 包(RHEL,Centos)。
如果我们想知道所有用户登陆服务器所使用的时间之和,我们可以直接运行 ac 命令,无需任何参数。
$?ac total?????1261.72
如果我们想知道各个用户所使用时间,可以加上 -p 选项。
$?ac?-p shark????????????????????????????????5.24 alvin????????????????????????????????5.52 shs???????????????????????????????1251.00 total?????1261.76
我们还可以通过加上 -d 选项来查看具体每一天用户使用服务器时间之和。
$?ac?-d?|?tail?-10 Jan?11??total????????0.05 Jan?12??total????????1.36 Jan?13??total???????16.39 Jan?15??total???????55.33 Jan?16??total???????38.02 Jan?17??total???????28.51 Jan?19??total???????48.66 Jan?20??total????????1.37 Jan?22??total???????23.48 Today???total????????9.83
我们可以使用很多命令来监控系统的运行状态,本文主要介绍了三个:watch 命令可以让你重复执行某一条命令来监控一些参数的变化,top 命令可以查看某个用户运行的进程数以及消耗的资源,而 ac 命令则可以查看每个用户使用服务器时间。你经常使用哪个命令呢?