一文掌握线程池实现原理

线程池简介

Java在使用线程执行程序时,需要调用操作系统内核的API创建一个内核线程,操作系统要为线程分配一系列的资源;当该Java线程被终止时,对应的内核线程也会被回收。因此,频繁的创建和销毁线程需要消耗大量资源。此外,由于CPU核数有限,大量的线程上下文切换会增加系统的性能开销,无限制地创建线程还可能导致内存溢出。为此,Java在JDK1.5版本中引入了线程池。

线程池是一种重用线程的机制,用于提高线程的利用率和管理线程的生命周期,常用于多线程编程异步编程

线程池的优点:

  • 降低资源消耗:线程池中的线程可以重复使用,避免因频繁创建和销毁线程而带来的性能开销。
  • 提高响应速度:向线程池中提交任务时,无需创建线程即可执行任务处理。
  • 方便线程管理:线程池可以对其中的线程进行统一管理、监控,避免因大量创建线程而导致内存溢出。

线程池实现原理

Java线程池的核心实现类为ThreadPoolExecutor。

ThreadPoolExecutor依赖关系

ThreadPoolExecutor依赖关系图:

一文掌握线程池实现原理
ThreadPoolExecutor依赖关系图

其中:

  • Executor(接口):该接口线程池处理任务的顶级接口,定义了一个用于执行任务的方法execute(Runnable command)。其中参数command为实现了Runnable或Callable接口的Task任务。
  • ExecutorService(接口):该接口继承了Executor接口,它扩展了Executor接口,并添加了一些管理线程池的方法(如:提交任务、关闭线程池等)。
  • AbstractExecutorService(抽象类):该类实现了ExecutorService接口。

构造函数

如ThreadPoolExecutor依赖关系图所示,ThreadPoolExecutor类提供了四个构造函数,其中原始的构造函数(另外三个构造函数由原始构造函数衍生而来):

线程池的构造函数:

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler)
 
{
    if (corePoolSize < 0 ||
        maximumPoolSize <= 0 ||
        maximumPoolSize < corePoolSize ||
        keepAliveTime < 0)
        throw new IllegalArgumentException();
    if (workQueue == null || threadFactory == null || handler == null)
        throw new NullPointerException();
    this.acc = System.getSecurityManager() == null ?
            null :
            AccessController.getContext();
    this.corePoolSize = corePoolSize;
    this.maximumPoolSize = maximumPoolSize;
    this.workQueue = workQueue;
    this.keepAliveTime = unit.toNanos(keepAliveTime);
    this.threadFactory = threadFactory;
    this.handler = handler;
}

核心参数:

  • corePoolSize:线程池中的核心线程数,当向线程池中提交任务时,线程池创建新线程执行任务处理,直到当前线程数达到corePoolSize设定的值。此时提交的新任务会被添加到阻塞队列中,等待其他线程执行完成。默认情况下,空闲的核心线程并不会被回收(即:属性allowCoreThreadTimeOut的值默认为false),如果需要回收空闲的核心线程,设置属性allowCoreThreadTimeOut的值为true即可。

  • maximumPoolSize:线程池中的最大线程数,当线程池中的线程数达到corePoolSize设定的值且核心线程均被占用时,如果阻塞队列已满并向线程池中继续提交任务,则创建新的线程执行任务处理,直到当前线程数达到maximumPoolSize设定的值。

  • keepAliveTime:线程池中线程的存活时间,该参数只会在线程数大于corePoolSize设定的值时才生效,即:非核心线程的空闲时间超过keepAliveTime设定的值时会被回收。

  • unit:线程池中参数keepAliveTime的时间单位,默认为TimeUnit.MILLISECONDS(毫秒),其他时间单位:


    • TimeUnit.NANOSECONDS(纳秒)
    • TimeUnit.MICROSECONDS(微秒)
    • TimeUnit.MILLISECONDS(毫秒)
    • TimeUnit.SECONDS(秒)
    • TimeUnit.MINUTES(分钟)
    • TimeUnit.HOURS(小时)
    • TimeUnit.DAYS(天)
  • workQueue:线程池中保存任务的阻塞队列,当线程池中的线程数达到corePoolSize设定的值,继续提交任务时会将任务添加到阻塞队列中等待。默认为LinkedBlockingQueue,可选择的阻塞队列:


    • LinkedBlockingQueue(基于链表实现的阻塞队列)。
    • ArrayBlockingQueue(基于数组实现的阻塞队列)。
    • SynchronousQueue(只有一个元素的阻塞队列)。
    • PriorityBlockingQueue(实现了优先级的阻塞队列)。
    • DelayQueue(实现了延迟功能的阻塞队列)。
  • threadFactory:线程池中创建线程的工厂,可以通过自定义线程工厂的方式为线程设置一个便于识别的线程名,默认为DefaultThreadFactory。

  • handler:线程池的拒绝策略(又称饱和策略),当线程池中的线程数达到maximumPoolSize设定的值且阻塞队列已满时,继续向线程池中提交任务,就会触发拒绝策略,默认为AbortPolicy。可选的拒绝策略:


    • AbortPolicy:丢弃任务,并抛出RejectedExecutionException异常。
    • DiscardPolicy:丢弃任务,不抛出异常。
    • DiscardOldestPolicy:丢弃队列中最早的未处理的任务,执行当前任务。
    • CallerRunsPolicy:由调用者所在的线程来执行任务。

线程池生命周期

在ThreadPoolExecutor类中定义了线程池的五种状态。

源码如下:

// ctl共32位,其中高3位表示线程池运行状态,低29位表示线程池中的线程数量。
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static final int COUNT_BITS = Integer.SIZE - 3;

// 二进制为0001 1111 1111 1111 1111 1111 1111 1111
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;

// runState is stored in the high-order bits
// RUNNING状态:二进制为111 00000000000000000000000000000
private static final int RUNNING    = -1 << COUNT_BITS;
// SHUTDOWN状态:二进制为000 00000000000000000000000000000
private static final int SHUTDOWN   =  0 << COUNT_BITS;
// STOP状态:二进制为001 00000000000000000000000000000
private static final int STOP       =  1 << COUNT_BITS;
// TIDYING状态:二进制为010 00000000000000000000000000000
private static final int TIDYING    =  2 << COUNT_BITS;
// TERMINATED状态:二进制011 00000000000000000000000000000
private static final int TERMINATED =  3 << COUNT_BITS;

// Packing and unpacking ctl
private static int runStateOf(int c)     return c & ~CAPACITY; }
// 线程池中的线程数量
private static int workerCountOf(int c)  return c & CAPACITY; }
private static int ctlOf(int rs, int wc) return rs | wc; }

其中:

ctl是一个AtomicInteger类型的变量:

  • 高3位表示线程池的运行状态。
  • 低29位表示线程池中的线程数量。

线程池运行状态:

  • RUNNING:处于RUNNING状态的线程池会接受新任务提交,同时也会处理任务队列中的任务。
  • SHUTDOWN:处于SHUTDOWN状态的线程池不会接受新任务提交,但是会处理任务队列中的任务。
  • STOP:处于STOP状态的线程池不会接受新任务提交,也不会处理任务队列中的任务,并且会中断正在执行的任务。
  • TIDYING:当所有的任务已终止、workerCount数量为0时,线程池会进入TIDYING状态,进入TIDYING状态会执行钩子方法terminated()。
  • TERMINATED:执行完钩子方法terminated()后进入TERMINATED状态,此时线程池已终止。

线程池状态转换,如图所示:

一文掌握线程池实现原理
线程池状态转换图

工作线程

Worker(工作线程)是ThreadPoolExecutor的一个内部类,它继承了 AbstractQueuedSynchronizer(即:AQS)并实现了Runnable接口。其中:

  • 通过继承AbstractQueuedSynchronizer类,可以控制在主线程中调用shutdown()方法时不会中断正在执行的工作线程。注意:调用shutdownNow()时会中断正在执行的工作线程。
  • 通过实现Runnable接口,可以在run()方法中调用ThreadPoolExecutor#runWorker方法执行任务处理。

提交任务

向线程池中提交任务的方式有两种:

  • 调用execute()方法。
  • 调用submit()方法。

execute与submit的区别:

  • 1)execute是Executor接口的方法,submit是ExecuteService接口的方法。
  • 2)execute的入参为Runnable,submit的入参可以为Runnable、Callable、Runnable和一个返回值。
  • 3)execute没有返回值,submit有返回值。
  • 4)异常处理:execute会直接抛出异常,submit会在获取结果时抛出异常,如果不获取结果,submit不抛出异常。

以execute()方法为例,ThreadPoolExecutor实现了Executor接口定义的execute(Runnable command) 方法,该方法的主要作用是将任务提交到线程池中的执行。

execute(Runnable command) 方法源码如下:

public void execute(Runnable command) {
    // 如果command为null,则抛出空指针异常
    if (command == null)
        throw new NullPointerException();
    // 获取ctl变量值,ctl低29位用来表示线程池中的线程数量。
    int c = ctl.get();
    // 如果线程池中的线程数小于设定的核心线程数,则将任务封装成Worker线程并调用其start()方法启动线程
    if (workerCountOf(c) < corePoolSize) {
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
    // 如果线程池处于运行状态并向任务队列中添加任务成功,则执行如下逻辑(此处线程池中的线程数大于等于核心线程数)
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        // 继续判断线程池处于运行状态,如果线程池不是运行状态且从线程池中移除任务成功,则执行拒绝策略
        if (! isRunning(recheck) && remove(command))
            reject(command);
        // 如果线程池中线程数为0,则创建Worker线程并执行任务
        else if (workerCountOf(recheck) == 0)
            addWorker(nullfalse);
    }
    // 如果创建Worker线程失败,则执行拒绝策略
    else if (!addWorker(command, false))
        reject(command);
}

ThreadPoolExecutore#xecute()方法执行逻辑,如图所示:

一文掌握线程池实现原理
ThreadPoolExecutor#execute()方法执行逻辑

处理流程:

1)主线程通过execute()方法向线程池中提交任务:

  • 线程池中的线程数小于核心线程数,继续向线程池中提交任务时,创建线程执行任务处理。

  • 线程池中的线程数大于等于核心线程数:

    a) 如果阻塞队列未满,继续向线程池中提交任务时,将任务添加到阻塞队列中,等待处理。

    b) 如果阻塞队列已满且线程数小于最大线程数,继续向线程池中提交任务时,创建线程执行任务处理。

    c) 如果阻塞队列已满且线程数大于等于最大线程数,继续向线程池中提交任务时,执行拒绝策略。

执行任务

任务提交到线程池中后,会执行工作线程(Worker)的ThreadPoolExecutor.Worker#run方法执行任务处理,而run()方法中会调用ThreadPoolExecutor#runWorker方法。

ThreadPoolExecutor#runWorker方法中,通过自旋的方式从Worker工作线程或阻塞队列中获取任务进行处理:

  • 如果Worker工作线程中存在任务,则执行Worker工作线程中的任务。
  • 如果Worker工作线程中不存在任务,则通过getTask()方法从获取任务,并执行该任务。
  • 如果Worker工作线程和阻塞队列中没有可执行的任务,则退出并销毁Worker工作线程。

线程池工作流程

线程池工作流程,如图所示:

一文掌握线程池实现原理
线程池工作流程

处理流程:

1)向线程池中提交任务,判断线程池中线程数是否小于核心线程数:

  • 线程数小于核心线程数,则创建线程执行任务处理。

  • 线程数大于等于核心线程数,则判断线程池中阻塞队列是否已满:

    a) 阻塞队列未满,则将任务添加到阻塞队列中,等待执行。

    b) 阻塞队列已满,则判断线程池中的线程数是否小于最大线程数:

    线程数小于最大线程数,则创建线程执行任务处理。

    线程数大于等于最大线程数,则执行拒绝策略。

线程池创建方式

线程池的创建方式一般分为两种:

  • 通过Executors类创建线程池。
  • 通过ThreadPoolExecutor类创建线程池。

通过Executors类创建线程池

Executors类是JDK提供的一个创建线程池的工具类,内部通过调用ThreadPoolExecutor构造函数来实现,通过该类提供的静态方法可以快速创建一些常用线程池。

newFixedThreadPool

创建一个固定大小的线程池,可控制并发的线程数,超出的线程会在队列中等待。

静态方法:

public static ExecutorService newFixedThreadPool(int nThreads) {
    return new ThreadPoolExecutor(nThreads, nThreads,
                                  0L, TimeUnit.MILLISECONDS,
                                  new LinkedBlockingQueue<Runnable>());
}

其中:

  • 核心线程数为初始化时指定的线程数,核心线程数等于最大线程数。
  • 线程存活时间keepAliveTime为0,表示线程空闲时立刻被回收。
  • 阻塞队列为LinkedBlockingQueue(默认值)。

newCachedThreadPool

创建一个可缓存的线程池,该线程池的大小为Integer.MAX_VALUE,对于提交的新任务:

  • 如果存在空闲线程,则使用空闲线程来执行任务处理。
  • 如果不存在空闲线程,则新建一个线程来执行任务处理。
  • 如果线程池中的线程数超过处理任务需要的线程数,则空闲线程缓存一段时间(60s)后会被回收。

静态方法:

public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                  60L, TimeUnit.SECONDS,
                                  new SynchronousQueue<Runnable>());
}

其中:

  • 核心线程数为0。
  • 最大线程数为Integer.MAX_VALUE。
  • 线程存活时间keepAliveTime为60s。
  • 阻塞队列为SynchronousQueue(同步队列)。

newSingleThreadExecutor

创建一个单线程化的线程池,它只有一个工作线程来执行任务,所有任务按照先进先出的顺序执行。

静态方法:

public static ExecutorService newSingleThreadExecutor() {
    return new FinalizableDelegatedExecutorService
        (new ThreadPoolExecutor(11,
                                0L, TimeUnit.MILLISECONDS,
                                new LinkedBlockingQueue<Runnable>()));
}

其中:

  • 核心线程数为1。
  • 最大线程数为1。
  • 线程存活时间keepAliveTime为0,表示线程空闲时立刻被回收。
  • 阻塞队列为LinkedBlockingQueue。

newScheduledThreadPool

创建一个计划线程池,支持定时或周期性的执行任务(如:延时任务)。

静态方法:

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
    return new ScheduledThreadPoolExecutor(corePoolSize);
}
public ScheduledThreadPoolExecutor(int corePoolSize) {
    super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
          new DelayedWorkQueue());
}

其中:

  • 核心线程数为初始化时指定的线程数。
  • 最大线程数为Integer.MAX_VALUE。
  • 线程存活时间keepAliveTime为0,表示线程空闲时立刻被回收。
  • 阻塞队列为DelayedWorkQueue(延时队列)。

其他线程池

Executors工具类除了能快速创建以上的常用线程池外,还可以创建很多其他线程池。如:

  • Executors.newSingleThreadScheduledExecutor:创建一个单线程化的计划线程池(newScheduledThreadPool的单线程版本)。
  • Executors.newWorkStealingPool:创建一个抢占式执行的线程池(任务执行顺序不确定),该线程池JDK1.8添加。

代码示例:

ExecutorsExample.java

@Slf4j
public class ExecutorsExample {
    /**
     * 创建一个固定大小的线程池
     */

    private static ExecutorService executor = Executors.newFixedThreadPool(10);
    public static void main(String[] args) {
        for (int i = 0; i < 10000; i++) {
            // 在线程池中执行任务
            executor.execute(new Task());
        }
    }
    /**
     * 任务线程
     */

    static class Task implements Runnable {
        @Override
        public void run() {
            try {
                Thread.sleep(1000);
                log.info("执行线程:{}", Thread.currentThread().getName());
            } catch (InterruptedException e) {
                log.info("线程中断异常");
            }
        }
    }
}

不推荐使用Executors类创建线程池,主要原因:Executors类创建线程池默认使用LinkedBlockingQueue,LinkedBlockingQueue默认大小为Integer.MAX_VALUE(相当于无界队列),在高负载情况下很容易导致OOM。因此,强烈建议使用有界队列创建线程池。

通过ThreadPoolExecutor类创建线程池

通过ThreadPoolExecutor类手动创建线程池(推荐方式)。

代码示例:

ThreadPoolExecutorExample.java

@Slf4j
public class ThreadPoolExecutorExample {
    /**
     * 定义线程池
     */

    private static ExecutorService pool ;
    public static void main(String[] args) {
        // 创建线程池
        pool = new ThreadPoolExecutor(10200,
                TimeUnit.SECONDS,
                new ArrayBlockingQueue<>(5),
                Executors.defaultThreadFactory(),
                new ThreadPoolExecutor.AbortPolicy()
        );
        // 在线程池中执行任务
        for (int i = 0; i < 10000; i++) {
            pool.execute(new ThreadPoolExecutorExample.Task());
        }
    }
    /**
     * 任务线程
     */

    static class Task implements Runnable {
        @Override
        public void run() {
            try {
                Thread.sleep(1000);
                log.info("执行线程:{}", Thread.currentThread().getName());
            } catch (InterruptedException e) {
                log.info("线程中断异常");
            }
        }
    }
}

其他推荐方式:通过commons-lang3、com.google.guava等工具包创建线程池,创建示例自行查阅相关资料即可。

线程池大小设置

在并发编程领域,提升性能本质上就是提升硬件的利用率(即:提升CPU和I/O设备综合利用率)的问题。因此,线程池大小需要根据CPU密集型和I/O密集型场景进行设置:

  • 对于CPU密集型场景,线程池大小一般设置为:CPU核数 + 1。
  • 对于I/O密集型场景,线程池大小一般设置为:CPU核数 * [1 +(I/O耗时 / CPU耗时)]。

以上公式仅作为参考值,具体情况需要根据压测情况进行设置。


一文掌握线程池实现原理

原文始发于微信公众号(小小开发者):一文掌握线程池实现原理

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/269296.html

(0)
Java朝阳的头像Java朝阳

相关推荐

发表回复

登录后才能评论
极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!