并发工具类以及AQS

1 AQS

谈到并发，不得不谈ReentrantLock；而谈到ReentrantLock，不得不谈AbstractQueuedSynchronizer。

类如其名，抽象的队列式的同步器，AQS定义了一套多线程访问共享资源的同步器框架，许多同步类实现都依赖于它，是同步类的最核心的一个类，如常用的ReentrantLock/Semaphore/CountDownLatch…。

1.1 整体框架

它维护了一个volatile int state（代表共享资源）和一个FIFO线程等待队列（多线程争用资源被阻塞时会进入此队列）。state的访问方式有三种: 1.getState()；2.setState()；3.compareAndSetState()。

AQS定义两种资源共享方式：Exclusive（独占，只有一个线程能执行，如ReentrantLock）和Share（共享，多个线程可同时执行，如Semaphore/CountDownLatch）。

不同的自定义同步器争用共享资源的方式也不同。自定义同步器在实现时只需要实现共享资源state的获取与释放方式即可，至于具体线程等待队列的维护（如获取资源失败入队/唤醒出队等），AQS已经在顶层实现好了。自定义同步器实现时主要实现以下几种方法：

（1）isHeldExclusively()：该线程是否正在独占资源。只有用到condition才需要去实现它。

（2）tryAcquire(int)：独占方式。尝试获取资源，成功则返回true，失败则返回false。

（3）tryRelease(int)：独占方式。尝试释放资源，成功则返回true，失败则返回false。

（4）tryAcquireShared(int)：共享方式。尝试获取资源。负数表示失败；0表示成功，但没有剩余可用资源；正数表示成功，且有剩余资源。

（5）tryReleaseShared(int)：共享方式。尝试释放资源，如果释放后允许唤醒后续等待结点返回true，否则返回false。

以ReentrantLock为例，state初始化为0，表示未锁定状态。A线程lock()时，会调用tryAcquire()独占该锁并将state+1。此后，其他线程再tryAcquire()时就会失败，直到A线程unlock()到state=0（即释放锁）为止，其它线程才有机会获取该锁。当然，释放锁之前，A线程自己是可以重复获取此锁的（state会累加），这就是可重入的概念。但要注意，获取多少次就要释放多么次，这样才能保证state是能回到零态的。

以CountDownLatch以例，任务分为N个子线程去执行，state也初始化为N（注意N要与线程个数一致）。这N个子线程是并行执行的，每个子线程执行完后countDown()一次，state会CAS减1。等到所有子线程都执行完后(即state=0)，会unpark()主调用线程，然后主调用线程就会从await()函数返回，继续后续动作。

一般来说，自定义同步器要么是独占方法，要么是共享方式，他们也只需实现tryAcquire-tryRelease、tryAcquireShared-tryReleaseShared中的一种即可。但AQS也支持自定义同步器同时实现独占和共享两种方式，如ReentrantReadWriteLock。

1.2 源码解析

依照acquire-release、acquireShared-releaseShared的次序来，以非公平锁为例。

1.2.1 节点状态waitStatus

Node结点是对每一个等待获取资源的线程的封装，其包含了需要同步的线程本身及其等待状态，如是否被阻塞、是否等待唤醒、是否已经被取消等。变量waitStatus则表示当前Node结点的等待状态，共有5种取值CANCELLED、SIGNAL、CONDITION、PROPAGATE、0。

CANCELLED(1)：表示当前结点已取消调度。当timeout或被中断（响应中断的情况下），会触发变更为此状态，进入该状态后的结点将不会再变化。
SIGNAL(-1)：表示后继结点在等待当前结点唤醒。后继结点入队时，会将前继结点的状态更新为SIGNAL。
CONDITION(-2)：表示结点等待在Condition上，当其他线程调用了Condition的signal()方法后，CONDITION状态的结点将从等待队列转移到同步队列中，等待获取同步锁。
PROPAGATE(-3)：共享模式下，前继结点不仅会唤醒其后继结点，同时也可能会唤醒后继的后继结点。
0：新结点入队时的默认状态。

注意，负值表示结点处于有效等待状态，而正值表示结点已被取消。所以源码中很多地方用>0、<0来判断结点的状态是否正常。

1.2.2 acquire(int) — *

此方法是独占模式下线程获取共享资源的顶层入口。如果获取到资源，线程直接返回，否则进入等待队列，直到获取到资源为止，且整个过程忽略中断的影响。这也正是lock()的语义，当然不仅仅只限于lock()。获取到资源后，线程就可以去执行其临界区代码了。

public final void acquire(int arg){
    if (!tryAcquire(arg) && 
        acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
        selfInterrupt();
}

函数流程如下：

tryAcquire()尝试直接去获取资源，如果成功则直接返回，这里体现了非公平锁，每个线程获取锁时会尝试直接抢占加塞一次，而CLH队列中可能还有别的线程在等待。(若是公平锁的话，如果不是队列中的第一个，这里不允许抢占资源)；
addWaiter()将该线程加入等待队列的尾部，并标记为独占模式；
acquireQueued()使线程阻塞在等待队列中获取资源，一直获取到资源后才返回。如果在整个等待过程中被中断过，则返回true，否则返回false。

如果线程在等待过程中被中断过，它是不响应的。只是获取资源后才再进行自我中断selfInterrupt()，将中断补上。

1.2.2.1 tryAcquire

1
2
3

protected boolean tryAcquire(int arg){
    throw new UnsupportedOperationException();
}

此方法尝试去获取独占资源。如果获取成功，则直接返回true，否则直接返回false。这也正是tryLock()的语义。

AQS这里只定义了一个接口，具体资源的获取交由自定义同步器去实现了（通过state的get/set/CAS）！！！至于能不能重入，能不能加塞，那就看具体的自定义同步器怎么去设计了！！！当然，自定义同步器在进行资源访问时要考虑线程安全的影响。

1.2.2.2 addWaiter

此方法用于将当前线程加入到等待队列的队尾，并返回当前线程所在的结点。

private Node addWaiter(Node mode) {
    //以给定模式构造节点，mode有两种：EXCLUSIVE(独占)，SHARED(共享)
    Node node = new Node(Thread.currentThread(), mode);
    
    //尝试快速方式直接放到队尾
    Node pred = tail;
    if(pred != null){
        node.prev = pred;
        if(compareAndSetTail(pred, node)){
            pred.next = node;
            return node;
        }
    }
    
    //上一步失败则通过enq入队
    enq(node);
    return node;
}

private Node enq(final Node node){
    //CAS自旋，直到成功加入队尾
    for(;;){
        Node t = tail;
        //队列为空，创建一个空的标志节点作为head节点，并将tail也指向它
        if (t == null) {
            if(compareAndSetHead(new Node()))
                tail = head;
        } else {  //正常流程，放入队尾
            node.prev = t;
            if(compareAndSetTail(t, node)) {
                t.next = node;
                return t;
            }
        }
    }
}

1.2.2.3 acquireQueued

进入等待状态休息，直到其他线程彻底释放资源后唤醒自己，自己再拿到资源，然后就可以去干自己想干的事了。acquireQueued()就是干这件事：在等待队列中排队拿号（中间没其它事干可以休息），直到拿到号后再返回。这个函数非常关键。

final boolean acquireQueued(final Node node, int arg) {
    boolean failed = true; //标记是否成功拿到资源
    try {
        boolean interrupt = false; //标记等待过程中是否被中断过
        
        //自旋
        for(;;) {
            final Node p = node.predecessor(); //拿到前驱
            //如果前驱是head，即该节点已成老二，那么便有资格去尝试获取资源（可能老大释放完资源唤醒自己的，当然也有可能interrupt了）
            if(p == head && tryAcquire(arg)) {
                setHead(node); //拿到资源后，将head指向该节点，所以head所指的标杆节点，就是当前获取到资源的那个节点或null
                p.next = null; //setHead中node.prev已值为null，此处再将head.next值为null，就是为了方便GC回收以前的head节点，也就意味着之前拿完资源的节点出队了
                failed = false; //成功获取资源
                return interrupt; //返回等待过程中是否被中断过
            }
            
            //如果自己可以休息了，就是通过park进入waiting状态，直到被unpark，如果不可中断的情况下被中断了，那么会从park中醒过来，发现拿不到资源，从而继续进入park等待
            if(shouldParkAfterFailedAcquire(p, node) && 
               parkAndCheckInterrupt())
                interrupted = true; //如果等待过程中被中断过，哪怕只有一次，就将interrupt标记为true
        }
    } finally {
        //如果等待过程中没有成功获取资源（如timeout，或者可中断的情况下被中断了），那么取消节点再队列中的等待
        if (failed){
            cancelAcquire(node);
        }
    }
}

shouldParkAfterFailedAcquire(Node, Node)

此方法主要用于检查状态，看看自己是否真的可以去休息了（进入waiting状态），万一队列前边的线程都放弃了只是瞎站着。整个流程中，如果前驱结点的状态不是SIGNAL，那么自己就不能安心去休息，需要去找个安心的休息点，同时可以再尝试下看有没有机会轮到自己拿号。

private static boolean shouldParkAfterFailedAcquire(Node pred, Node node){
    int ws = pred.waitStatus;//拿到前驱的状态
    if(ws == Node.SIGNAL)
        //如果已经告诉前驱拿完号后通知自己一下，那就可以安心休息了
        return true;
    if(ws > 0) {
        //如果前驱放弃了，那就一直往前找，直到找到最近一个正常等待的状态，并排在它的后边
        //注意：那些放弃的节点，由于被自己加塞到它们前边，它们相当于形成一个无引用链，稍后就会被GC了
        do {
            node.prev = pred = pred.prev;
        } while (pred.waitStatus > 0);
        pred.next = node;
    } else {
        //如果前驱正常，那就把前驱的状态设置成SIGNAL，告诉它拿完号后通知自己一下，有可能失败，人家说不定刚释放完
        compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
    }
    return false;
}

parkAndCheckInterrupt()

如果线程找好安全休息点后，那就可以安心去休息了。此方法就是让线程去休息，真正进入等待状态。

private final boolean parkAndCheakInterrypt(){
    LockSupport.park(this); //调用park使线程进入waiting状态
    return Thread.interruted();//如果被唤醒，查看自己是不是被中断的
}

park()会让当前线程进入waiting状态。在此状态下，有两种途径可以唤醒该线程：1）被unpark()；2）被interrupt()。需要注意的是，Thread.interrupted()会清除当前线程的中断标记位。

小结：

回到acquireQueued()，总结下该函数的具体流程：

结点进入队尾后，检查状态，找到安全休息点；
调用park()进入waiting状态，等待unpark()或interrupt()唤醒自己；
被唤醒后，看自己是不是有资格能拿到号。如果拿到，head指向当前结点，并返回从入队到拿到号的整个过程中是否被中断过；如果没拿到，继续流程1。

1.2.3 release(int) — *

此方法是独占模式下线程释放共享资源的顶层入口。它会释放指定量的资源，如果彻底释放了（即state=0）,它会唤醒等待队列里的其他线程来获取资源。这也正是unlock()的语义。

public final boolean release(int arg) {
    if (tryRelease(arg)) {
        Node h = head; //找到头节点
        if (h != null && h.waitStatus != 0) {
            unparkSuccessor(h); //唤醒等待队列里的下一个线程
        }
        return true;
    }
    return false;
}

它调用tryRelease()来释放资源。有一点需要注意的是，它是根据tryRelease()的返回值来判断该线程是否已经完成释放掉资源了！所以自定义同步器在设计tryRelease()的时候要明确这一点！！

1.2.3.1 tryRelease

此方法尝试去释放指定量的资源。

1
2
3

protected boolean tryRelease(int arg) {
    throw new UnsupportedOperaionException();
}

跟tryAcquire()一样，这个方法是需要独占模式的自定义同步器去实现的。正常来说，tryRelease()都会成功的，因为这是独占模式，该线程来释放资源，那么它肯定已经拿到独占资源了，直接减掉相应量的资源即可(state-=arg)，也不需要考虑线程安全的问题。但要注意它的返回值，上面已经提到了，release()是根据tryRelease()的返回值来判断该线程是否已经完成释放掉资源了！所以自义定同步器在实现时，如果已经彻底释放资源(state=0)，要返回true，否则返回false。

1.2.3.2 unparkSuccessor

此方法用于唤醒等待队列中下一个线程。

private void unparkSuccessor(Node node){
    //这里，node一般为当前线程所在的节点
    int ws = node.waitStatus;
    if(ws < 0) //置0当前线程所在的节点的状态，允许失败
        compareAnddSetWaitStatus(node, ws, 0);
    
    Node s = node.next; //找到下一个需要唤醒的节点
    if (s == null || s.waitStatue > 0) {  //如果为空或者已取消
        s = null;
        for(Node t = tail; t != null; t = t.prev)  //从后往前找
            if(t.waitStatus <= 0) //从这里可以看出，<=0的节点，都是还有效的节点
                s = t;
    }
    if (s != null)
        LockSupport.unpark(s.thread); //唤醒
}

一句话概括：用unpark()唤醒等待队列中最前边的那个未放弃线程，这里用s来表示。此时，再和acquireQueued()联系起来，s被唤醒后，进入if (p == head && tryAcquire(arg))的判断（即使p!=head也没关系，它会再进入shouldParkAfterFailedAcquire()寻找一个安全点。这里既然s已经是等待队列中最前边的那个未放弃线程了，那么通过shouldParkAfterFailedAcquire()的调整，s也必然会跑到head的next结点，下一次自旋p==head就成立了），然后s把自己设置成head标杆结点，表示自己已经获取到资源了，acquire()也返回了！！

小结：

release()是独占模式下线程释放共享资源的顶层入口。它会释放指定量的资源，如果彻底释放了（即state=0）,它会唤醒等待队列里的其他线程来获取资源。

有一个问题：如果获取锁的线程在release时异常了，没有unpark队列中的其他结点，这时队列中的其他结点会怎么办？是不是没法再被唤醒了？答案是YES！！！这时，队列中等待锁的线程将永远处于park状态，无法再被唤醒！！！但是再回头想想，获取锁的线程在什么情形下会release抛出异常呢？？

线程突然死掉了？可以通过thread.stop来停止线程的执行，但该函数的执行条件要严苛的多，而且函数注明是非线程安全的，已经标明Deprecated；
线程被interupt了？线程在运行态是不响应中断的，所以也不会抛出异常；
release代码有bug，抛出异常了？目前来看，Doug Lea的release方法还是比较健壮的，没有看出能引发异常的情形（如果有，恐怕早被用户吐槽了）。除非自己写的tryRelease()有bug，那就没啥说的，自己写的bug只能自己含着泪去承受了。

1.2.4 acquireShared(int) — *

此方法是共享模式下线程获取共享资源的顶层入口。它会获取指定量的资源，获取成功则直接返回，获取失败则进入等待队列，直到获取到资源为止，整个过程忽略中断。

public final void acquireShared(int arg){
    if(tryAcquireShared(arg) < 0)
        doAcquireShared(arg);
}

这里tryAcquireShared()依然需要自定义同步器去实现。但是AQS已经把其返回值的语义定义好了：负值代表获取失败；0代表获取成功，但没有剩余资源；正数表示获取成功，还有剩余资源，其他线程还可以去获取。所以这里acquireShared()的流程就是：

1.tryAcquireShared()尝试获取资源，成功则直接返回；

2.失败则通过doAcquireShared()进入等待队列，直到获取到资源为止才返回。

1.2.4.1 doAcquireShared

此方法用于将当前线程加入等待队列尾部休息，直到其他线程释放资源唤醒自己，自己成功拿到相应量的资源后才返回。

private void doAcquireShared(int arg){
    final Node node = addWaiter(Node.SHARED); //加入队列尾部
    boolean failed = true; //是否成功状态
    try {
        boolean interrupted = false; //等待过程中是否被中断过的标志
        for(;;) {
            final Node p = node.predecessor(); //前驱
            if(p == head) { //如果到head的下一个，因为head是拿到资源的线程，此时node被唤醒，可能是head用完资源来唤醒自己
                int r = tryAcquireShared(arg); //尝试获取资源
                if (r >= 0){ //成功
                    setHeadAndPropagate(node, r); //将head指向自己，还有剩余资源可以再唤醒之后的线程
                    p.next = null; //帮助GC
                    if (interrupted) //如果等待过程中被打断过，此时将中断补上
                        selfInterrupt();
                    failed = false;
                    return;
                }
            }
            //判断状态，寻找安全点，进入waiting状态，等着被unpark()或interrupt()
            if(shorldParkAfterFailedAcquire(p, node) && 
               parkAndCheckInterrupt())
                interrupted = true;
        }
    } finally {
        if (failed)
            cancelAcquire(node);
    }
}

1.2.4.2 setHeadAndPropagate

private void setHeadAndPropagate(Node node, int propagate){
    Node h = head;
    setHead(node); //head指向自己
    //如果还有余量，继续唤醒下一个邻居线程
    if(propagate > 0 || h == null | h.waitStatus < 0){
        Node s = node.next;
        if(s == null || s.isShared())
            doReleaseShared();
    }
}

此方法在setHead()的基础上多了一步，就是自己苏醒的同时，如果条件符合（比如还有剩余资源），还会去唤醒后继结点。

doReleaseShared()下一小节的releaseShared()里来讲。

小结

梳理一下acquireShared()的流程：

1.tryAcquireShared()尝试获取资源，成功则直接返回；

2.失败则通过doAcquireShared()进入等待队列park()，直到被unpark()/interrupt()并成功获取到资源才返回。整个等待过程也是忽略中断的。

其实跟acquire()的流程大同小异，只不过多了个自己拿到资源后，还会去唤醒后继队友的操作。

1.2.5 releaseShared() — *

此方法是共享模式下线程释放共享资源的顶层入口。它会释放指定量的资源，如果成功释放且允许唤醒等待线程，它会唤醒等待队列里的其他线程来获取资源。

public final boolean releaseShared(int arg){
    if(tryReleaseShared(arg)) { //尝试释放资源
        doReleaseShared(); //唤醒后继节点
        return true;
    }
    return false;
}

此方法的流程也比较简单，一句话：释放掉资源后，唤醒后继。跟独占模式下的release()相似，但有一点稍微需要注意：独占模式下的tryRelease()在完全释放掉资源（state=0）后，才会返回true去唤醒其他线程，这主要是基于独占下可重入的考量；而共享模式下的releaseShared()则没有这种要求，共享模式实质就是控制一定量的线程并发执行，那么拥有资源的线程在释放掉部分资源时就可以唤醒后继等待结点。例如，资源总量是13，A（5）和B（7）分别获取到资源并发运行，C（4）来时只剩1个资源就需要等待。A在运行过程中释放掉2个资源量，然后tryReleaseShared(2)返回true唤醒C，C一看只有3个仍不够继续等待；随后B又释放2个，tryReleaseShared(2)返回true唤醒C，C一看有5个够自己用了，然后C就可以跟A和B一起运行。而ReentrantReadWriteLock读锁的tryReleaseShared()只有在完全释放掉资源（state=0）才返回true，所以自定义同步器可以根据需要决定tryReleaseShared()的返回值。

1.2.5.1 doReleaseShared()

private void doReleaseShared() {
    for(;;) {
        Node h = head;
        if(h != null && h != tail) {
            int ws = h.waitStatus;
            if(ws == Node.SIGNAL){
                if(!compareAndSetWaitStatus(h, Node.SIGNAL, 0))
                    unparkSuccessor(h); //唤醒后继
            }else if(ws == 0 && !compareAndSetWaitStatus(h, 0, Node.PROPAGATE))
                continue;
        }
        if(h == head) //head发生变化
            break;
    }
}

1.2.6 小结

值得注意的是，acquire()和acquireShared()两种方法下，线程在等待队列中都是忽略中断的。AQS也支持响应中断的，acquireInterruptibly()/acquireSharedInterruptibly()即是，相应的源码跟acquire()和acquireShared()差不多。

2 其他工具类

2.1 CountDownLatch

CountDownLatch 允许一个或多个线程等待其他线程完成操作。CountDownLatch的构造函数接收一个int类型的参数作为计数器，如果想等待N个点完成，这里就传入N。

当调用一次CountDownLatch的countDown方法时，N就会减1，CountDownLatch的await会阻塞当前线程，直到N变成零。由于countDown方法可以用在任何地方，所以这里说的N个点，可以是N个线程，也可以是1个线程里的N个执行步骤。用在多个线程时，只需要把这个CountDownLatch的引用传递到线程里。

如果有某个解析sheet的线程处理的比较慢，不可能让主线程一直等待，所以可以使用另外一个带指定时间的await方法，await(long time, TimeUnit unit): 这个方法等待特定时间后，就会不再阻塞当前线程。join也有类似的方法。

注意：计数器必须大于等于0，只是等于0时候，计数器就是零，调用await方法时不会阻塞当前线程。CountDownLatch不可能重新初始化或者修改CountDownLatch对象的内部计数器的值。一个线程调用countDown方法 happen-before 另外一个线程调用await方法。

2.2 CyclicBarrier(同步屏障)

CyclicBarrier 的字面意思是可循环使用（Cyclic）的屏障（Barrier）。它要做的事情是，让一组线程到达一个屏障（也可以叫同步点）时被阻塞，直到最后一个线程到达屏障时，屏障才会开门，所有被屏障拦截的线程才会继续干活。CyclicBarrier默认的构造方法是CyclicBarrier(int parties)，其参数表示屏障拦截的线程数量，每个线程调用await方法告诉CyclicBarrier已经到达了屏障，然后当前线程被阻塞。

CyclicBarrier和CountDownLatch的区别

1.CountDownLatch的计数器只能使用一次。而CyclicBarrier的计数器可以使用reset() 方法重置。所以CyclicBarrier能处理更为复杂的业务场景，比如如果计算发生错误，可以重置计数器，并让线程们重新执行一次。

2.CyclicBarrier还提供其他有用的方法，比如getNumberWaiting方法可以获得CyclicBarrier阻塞的线程数量。isBroken方法用来知道阻塞的线程是否被中断。比如以下代码执行完之后会返回true。

2.3 控制并发线程数的Semaphore

Semaphore（信号量）是用来控制同时访问特定资源的线程数量，它通过协调各个线程，以保证合理的使用公共资源。

在代码中，虽然有30个线程在执行，但是只允许10个并发的执行。Semaphore的构造方法Semaphore(int permits) 接受一个整型的数字，表示可用的许可证数量。Semaphore(10)表示允许10个线程获取许可证，也就是最大并发数是10。Semaphore的用法也很简单，首先线程使用Semaphore的acquire()获取一个许可证，使用完之后调用release()归还许可证。还可以用tryAcquire()方法尝试获取许可证。

Semaphore还提供一些其他方法：

（1）int availablePermits() ：返回此信号量中当前可用的许可证数。

（2）int getQueueLength()：返回正在等待获取许可证的线程数。

（3）boolean hasQueuedThreads() ：是否有线程正在等待获取许可证。

（4）void reducePermits(int reduction) ：减少reduction个许可证。是个protected方法。

（5）Collection getQueuedThreads() ：返回所有等待获取许可证的线程集合。是个protected方法。

2.4 两个线程进行数据交换的Exchanger

Exchanger（交换者）是一个用于线程间协作的工具类。Exchanger用于进行线程间的数据交换。它提供一个同步点，在这个同步点两个线程可以交换彼此的数据。这两个线程通过exchange方法交换数据，如果第一个线程先执行exchange方法，它会一直等待第二个线程也执行exchange，当两个线程都到达同步点时，这两个线程就可以交换数据，将本线程生产出来的数据传递给对方。

如果两个线程有一个没有到达exchange方法，则会一直等待，如果担心有特殊情况发生，避免一直等待，可以使用exchange(V x, long timeout, TimeUnit unit)设置最大等待时长。

java基础 > 多线程

#多线程 #并发工具类 #AQS

并发工具类以及AQS

http://www.zivjie.cn/2023/03/12/java基础/多线程/并发工具类以及AQS/

作者

Francis

发布于

2023年3月12日

许可协议

volatile关键字上一篇

锁-synchronized 下一篇