现状生产系统CPU占用过高,并且进行了报警
文章插图
排查方法执行
top
命令,查看是那个进程导致的,可以确定是pid为22168的java应用导致的文章插图
执行
top -Hp
命令 , 查看这个进程的那个线程导致cpu过高 , 如下图,可以看到是22749线程导致的top -Hp 22168
文章插图
由于jstack里面的线程号为16进制,需要转换线程号为16进制,如下图得到16进制值为58dd
printf "%x\n" 22749
文章插图
执行jstack生成线程快照保存至1.txt文件中,22168为进程id
jstack 22168>1.txt
根据16进制线程号,查询线程信息grep 58dd 1.txt
文章插图
如上图,可以看到是调用DesenUtils.desen方法导致,此方法作用是数据脱敏,里面用了较为复杂的正则表达式,所以分析是由于特定字符正好遇到此正则表达式 , 进行大量计算导致,具体细节请访问(https://cloud.tencent.com/developer/article/1780881),为了快速解决此问题,先去除掉此代码的调用,重新发布即可 。
总结线上问题定位,相对比较简单 , 难点主要在于保留现场 , 有了现场就能快速定位问题,以下是二种常用排查方式
- CPU飙高通过
jstack
命令 , 定位到线程信息 。 - 内存飙高通过
jmap
dump出堆栈信息,在通过mat这些工具定位那个类占用过多内存 。
推荐阅读
- Linux 下搭建 Kafka 环境
- Hadoop生态系统—数据仓库Hive的安装
- mysql安装教程-window操作系统
- 医师电子化注册个人端入口 医师电子注册系统入口
- DNF勋章怎么获得怎么开启勋章(dnf勋章系统怎么玩)
- 你Win7系统如何将显卡驱动更新到最新版本
- tensorflow-gpu版本安装及深度神经网络训练与cpu版本对比
- 小米平板5可以用Windows系统吗_小米平板5能不能用Windows系统
- 荣耀v40是什么系统_荣耀v40搭载什么系统
- 分布式存储系统之Ceph集群启用Dashboard及使用Prometheus监控Ceph