排查线上JVM CPU飙升使用率高和线程死锁问题

一、排查CPU飙升使用率高问题

在开始前新建一个 SpringBoot 项目构建CPU使用率高的场景:

@RestController
public class JvmThread1Controller {

    ThreadPoolExecutor executor = new ThreadPoolExecutor(
            10,
            15,
            2,
            TimeUnit.SECONDS,
            new LinkedBlockingDeque<>(50),
            new ThreadPoolExecutor.CallerRunsPolicy()
    );

    @GetMapping("/cpuUsageRate")
    public String cpuUsageRate() {
        executor.submit(() -> {
            int i = 0;
            while (true) {
                i = i++ * 10 + 5;
                System.out.println(i);
            }
        });
        return "success";
    }
}

上面声明了一个线程池,每次使用线程就从这个里面取,在cpuUsageRate接口中,写了一个死循环,每次都对i进行计算,程序运行起来,肯定cpu的使用率特别高。

启动应用,调用cpuUsageRate接口。

通过 top 查看 cpu 使用情况:

排查线上JVM CPU飙升使用率高和线程死锁问题

可以看到有个 java 应用的 cpu 使用率已经达到了 100% ,不出意外这就是上面启动的 java服务,下面假设不知道问题在哪,看是否能分析出问题点。

排查过程

使用 jcmd 查看所有java进程:

jcmd
排查线上JVM CPU飙升使用率高和线程死锁问题

这个就是上面启动的java服务,上面的 top 中已经看出就是他 cpu 占用非常高,下面使用 top -Hp 查看该进程下的线程资源占用情况:

top -Hp 30038
排查线上JVM CPU飙升使用率高和线程死锁问题

可以看到线程ID为 30077 的使用率非常高,下面可以通过 jstack 查看该线程的详细情况,但 jstack 中的 ID 是 16 机制的,30077 是10进制的,因此需要通过 printf '%xn' 转换:

printf '%xn' 30077 
排查线上JVM CPU飙升使用率高和线程死锁问题

有了线程ID后,就可以通过 jstack 查看详情, -A 50表示关键位置后面50行的信息都取出来:

jstack 30038 | grep -50 757d
排查线上JVM CPU飙升使用率高和线程死锁问题

从提示的位置查找代码,可以非常清晰的找到问题所在:

排查线上JVM CPU飙升使用率高和线程死锁问题

二、排查线程死锁问题

上面我们定位到 cpu 使用率大的线程及定位到了具体位置,这里我们继续定位线程死锁问题,在开始前我们先构建一个死锁的环境:

@RestController
public class JvmThread2Controller {

    ThreadPoolExecutor executor = new ThreadPoolExecutor(
            10,
            15,
            2,
            TimeUnit.SECONDS,
            new LinkedBlockingDeque<>(50),
            new ThreadPoolExecutor.CallerRunsPolicy()
    );
 
    @GetMapping("/threadLock")
    public String threadLock() {
        Object resourceA = new Object();
        Object resourceB = new Object();
        executor.submit(() -> {
            synchronized (resourceA) {
                try {
                    TimeUnit.SECONDS.sleep(1);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                synchronized (resourceB) {
                }
            }
        });
        executor.submit(() -> {
            synchronized (resourceB) {
                try {
                    TimeUnit.SECONDS.sleep(1);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                synchronized (resourceA) {
                }
            }
        });
        return "success";
    }
}

上面在第一个线程中首先锁住了 resourceA,第二个线程首先锁住了resourceB,然后等待 1s 的时候,第一个线程再去获取 resourceB 的锁,第二个线程再去获取resourceA 的锁,这显然已经出现死锁了。

下面调用 threadLock 接口,触发死锁场景。下面假设不知道问题在哪,看是否能分析出问题点。

排查过程

使用 jcmd 查看所有java进程:

jcmd
排查线上JVM CPU飙升使用率高和线程死锁问题

进程为 5299 ,下面直接通过 jstack -l 寻找死锁的线程:

jstack -5299
排查线上JVM CPU飙升使用率高和线程死锁问题

从提示的位置查找代码,可以非常清晰的找到问题所在:

排查线上JVM CPU飙升使用率高和线程死锁问题


原文始发于微信公众号(狂热JAVA小毕超):排查线上JVM CPU飙升使用率高和线程死锁问题

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/240984.html

(0)
小半的头像小半

相关推荐

发表回复

登录后才能评论
极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!