通过 top 和 jstack 确定哪些线程耗尽了 CPU
背景 线上集群 load 会突然飙升,CPU 使用率 100%,无法响应正常请求,然后服务器宕机。 那么引起 load 飙升的线程究竟在做什么?哪些线程霸占了CPU?可以通过 top 和 jstack 命令进行定位。 定位步骤 1. top 找出占用 CPU 高的进程 PID 2. top -p PID -H 命令查出进程中占用CPU最高的线程 3. 根据线程ID(需要十进制转成十六进制),从线程栈中找出步骤2查出的线程 printf 0x%x 43845 4. jstack -l PID 命令打印出线程栈 发现是大量 GC 线程在运行。 为什么是 GC 线程呢? 最终定位问题是,调用数据库查询方法 List queryForList(Query query) 拉取大量数据集合加载到内存,这些集合数据还都是小数据。小数据首先被 JVM 加载到年轻代,但年轻代内存很快就占满,JVM 进行 yongGC,数据被转移到老年代,但老年代内存也很快被占满,JVM 有进行 full GC,由此造成雪崩,内存占用率 100%,CPU 使用率 100%。 Reference: http://itindex.net/detail/48388-jstack-%E7%BA%BF%E7%A8%8B-cpu 转载请并标注: “本文转载自 linkedkeeper.com ” ©著作权归作者所有 |