并发编程的目的是为了让程序运行的更快,但是并不是启动更多的线程就能使程序最大限度的并发执行。
在进行并发编程时,如果希望通过多线程执行任务的方式让程序运行的更快,会面临非常多的挑战,比如:上下文的切换问题,死锁的问题,以及受限于硬件和软件的资源限制问题等。
上下文切换
-
即使是单核处理器也支持多线程执行代码,CPU通过给每个线程分配CPU时间片来实现这个机制。时间片是CPU分配给各个线程的时间,因为时间片非常短,所以CPU通过不停的切换线程执行,让我们感觉多个线程是同时执行的,时间片一般是几十毫秒。 -
CPU通过时间片分配算法来循环执行任务,当前任务执行一个时间片后会切换到下一个任务。但是,在切换前会保存上一个任务的状态,以便下次切换回这个任务时,可以再加载这个任务的状态。因此任务从保存到再加载的过程就是一次上下文切换。
多线程一定快吗
下面我们通过代码演示串行和并发执行并累加操作的时间;并分析下面的代码并发执行一定比串行执行快吗?
public class ConcurrencyTest {
private static final long count = 10000l;
public static void main(String[] args) throws InterruptedException {
concurrency();
serial();
}
private static void serial() {
long start = System.currentTimeMillis();
int a = 0;
for (long i = 0; i < count; i++) {
a += 5;
}
int b = 0;
for (long i = 0; i < count; i++) {
b--;
}
long time = System.currentTimeMillis() - start;
System.out.println("serial:" + time+"ms,b="+b+",a="+a);
}
private static void concurrency() throws InterruptedException {
long start = System.currentTimeMillis();//获取当前时间戳
Thread thread = new Thread(() -> {
int a = 0;
for (long i = 0;i < count;i++){
a += 5;
}
});
thread.start();
int b = 0;
for (long i = 0;i < count;i++) {
b--;
}
long time = System.currentTimeMillis() - start;
thread.join();//调用线程等待,只有该线程执行完成之后,才能往下执行
System.out.println("concurrency :" + time+"ms,b="+b);
}
}
上述问题的答案是:不一定,测试结果如下表所示:
通过上表数据我们可以发现:当并发累加操作不超过百万次时,执行速度要比串行的慢。
如何减少上下文的切换
减少上下文切换的方法主要有:
-
无锁并发编程。
多线程竞争锁时,会引起上下文切换,因此多线程在处理数据时,可以用一些办法来避免使用锁,例如:将数据的ID按照Hash算法取模分段操作,不同的线程处理不同段的数据。
-
CAS算法。
Java的Atomic包使用CAS算法来更新数据,而不需要加锁。
-
使用最少线程。、
避免创建不必要的线程,比如任务很少,但是创建很多的线程来处理,这样就会造成大量的线程都处于等待的状态。
-
使用协程。在单线程里实现多任务的调度,并在单线程里维持多个任务间的切换。
死锁
什么是死锁?简单来说,就是两个线程在互相等待对方释放锁,从而形成的一种僵持局面,两方都达不到释放锁的条件,两个线程卡死无法执行下去。
一般可能会遇到当t1线程拿到锁后,由于异常情况、死循环没有释放锁,又或者t1拿到了数据库锁,释放锁的时候又出现了异常,导致没释放掉。
出现了死锁,如何排查是有必要了解的。
死锁的排查技巧
下面我们演示一段代码来演示遇到死锁是如何进行排查的
/**
* @author 公众号: SimpleMemory
* @version 1.0.0
* @ClassName JstackCase.java
* @Description TODO
* @createTime 2022年12月16日 22:02:00
*/
public class JstackCase {
public static Executor executor = Executors.newFixedThreadPool(5);
public static Object lock = new Object();
public static void main(String[] args) {
Task task1 = new Task();
Task task2 = new Task();
executor.execute(task1);
executor.execute(task2);
}
static class Task implements Runnable{
@Override
public void run() {
synchronized (lock){
calculate();
}
}
public void calculate(){
int i = 0;
while (true){
i++;
}
}
}
}
先运行该程序,其次打开cmd窗口,输入jps命令,查看java进程的pid。
执行命名:
jstack 21668 > log.txt
避免死锁的几种常见方法:
-
避免一个线程同时获取多个锁 -
避免一个线程在锁内同时占用多个资源,尽量保证每个锁只占用一个资源 -
尝试使用定时锁,使用lock.tryLock(timeout)来替代 -
对于数据库锁,加锁和解锁要在一个数据库连接里,否则会出现解锁失败的情况。
资源限制的挑战
资源限制是指在进行并发编程时,程序的执行速度受限于计算机硬件资源或软件资源。例如,服务器的带宽只有2Mb/s,某个资源的下载速度是1Mb/s每秒,系统启动10个线程下载资 源,下载速度不会变成10Mb/s,所以在进行并发编程时,要考虑这些资源的限制。硬件资源限 制有带宽的上传/下载速度、硬盘读写速度和CPU的处理速度。软件资源限制有数据库的连接 数和socket连接数等。
导致的问题:
在并发编程中,将代码执行速度加快的原则是将代码中串行执行的部分变成并发执行, 但是如果将某段串行的代码并发执行,因为受限于资源,仍然在串行执行,这时候程序不仅不 会加快执行,反而会更慢,因为增加了上下文切换和资源调度的时间。例如,之前看到一段程 序使用多线程在办公网并发地下载和处理数据时,导致CPU利用率达到100%,几个小时都不 能运行完成任务,后来修改成单线程,一个小时就执行完成了。
如何解决问题:
对于硬件资源限制,可以考虑使用集群并行执行程序。既然单机的资源有限制,那么就让程序在多机上运行。比如使用ODPS、Hadoop或者自己搭建服务器集群,不同的机器处理不同 的数据。可以通过“数据ID%机器数”,计算得到一个机器编号,然后由对应编号的机器处理这 笔数据。
对于软件资源限制,可以考虑使用资源池将资源复用。比如使用连接池将数据库和Socket 连接复用,或者在调用对方webservice接口获取数据时,只建立一个连接。
总结
通过以上的介绍,当我们在进行并发编程时,可能会遇到的几个挑战,并给予了一些解决的建议;对于程序开发人员而言,建议多使用JDK并发包提供的并发容器和工具类去解决并发问题,因为这些类都通过充分的测试和优化,均可解决以上提到的几个挑战。
原文始发于微信公众号(SimpleMemory):并发编程系列(一):并发编程的挑战
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/137812.html