常用的linux性能监测工具

 常用的linux性能监测工具

老wu自从搭建了博客网站之后,每天早上起来和晚上睡觉之前都要做一件事,就是访问一下网站的页面,看看有没有挂掉 😂 正所谓没有不被黑的网站,只是时间的问题,能及时发现网站被攻击可以降低造成的损失,老wu的服务器利用阿里云的自动快照功能,每天都有自动备份,出现问题就先直接恢复到前一天正常的网站再说。

但更多时候网站莫名挂掉是因为服务器资源耗尽了,比如突发的网络访问量暴涨,内存爆掉了等等。毕竟阿里云服务器太贵,服务器的配置老wu都是按照刚好够用的原则,按照实际的访问负载压力来配置的,阿里云服务器都是可以随时变更配置的,发现资源不足时就临时把服务器的配置上调一个档,然后再测试几天看看。

现在阿里云后台监测功能做的还算蛮完善的,有不错的后台性能监测器,还可以安装他家的手机APP随时随地监测服务器的资源压力,还可以设置预警值,比如磁盘占用率达到一定比例后自动给你发短信通知,像CPU占用率、内存、带宽等等常用的监测指标都可以设置短信告警值。

但这些指标都是一些比较粗粒度的监测值,你能通过这些指标发现服务器存在问题,但具体什么问题,还不好判断,比如你收到一个CPU占用率长时间都处于100%的告警,但具体是什么原因造成这么高的CPU使用率,是不是中毒了,或者服务器被当成肉鸡帮别人算比特率了,你就得进入linux系统的shell通过各种命令去查看相关的性能监测指标,比如通过ps命令查看当前进程情况,通过top命令查看系统中各个进程占用资源的情况,通过iftop查看各个进程的网络连接情况,是否有可疑进程连接到了可疑的外网IP。

这里老wu罗列一些平时维护linux常用到的命令供大家参考:

  • top 能实时查看系统中各个进程资源占用情况
  • free 可以显示Linux系统中空闲的、已用的物理内存及swap内存,及被内核使用的buffer
  • df 检查linux服务器的文件系统的磁盘空间占用情况。可以利用该命令来获取硬盘被占用了多少空间,目前还剩下多少空间等。
  • netstat 可用于列出系统上所有的网络套接字连接情况,包括 tcp, udp 以及 unix 套接字,另外它还能列出处于监听状态(即等待接入请求)的套接字。
  • iftop 实时流量监测工具

如果需要监测更多更加详细的linux性能指标,老wu这里分享一份歪果仁总结的PDF,里边图文并茂列举了很多相关的linux命令,值得收藏。
下载链接:
https://static.mr-wu.cn/doc/Velocity2015_LinuxPerfTools.pdf

吴川斌

吴川斌