《重学Java高并发》disruptor是如何做到百万级吞吐
终极手撕架构师的学习笔记:分布式+微服务+开源框架+性能优化《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》点击传送门即可获取!” />终极手撕架构师的学习笔记:分布式+微服务+开源框架+性能优化[外链图片转存中…(img-uyCSm1qq-1712230368032)]《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》点击传送门即可获取!
- Sequenced
环形缓存区与序号相关的操作,这个是环形缓存区的基本属性,不太好用语言来描述,我们通过它的核心方法来阐述:
- int getBufferSize()
获取缓存区大小
- boolean hasAvailableCapacity(int requiredCapacity)
是否还有requiredCapacity个空间供写入线程写入数据
- long remainingCapacity()
当前剩余容量。
- long next()
获取下一个可写入的下标(序号)
- long next(int n)
从环形队列中获取n个可用的下标,返回值为这批最大的可写入序号。
- long tryNext() throws InsufficientCapacityException
尝试从环形队列中获取一个可写入位置,如果没有空闲位置供写入则抛出异常。
- long tryNext(int n) throws InsufficientCapacityException
尝试从环形队列中获取n个可写入位置,如果没有空闲位置供写入则抛出异常。
- void publish(long sequence)
将处于下标sequence的位置“发布”,此时消费者可以从环形队列中消费。
- void publish(long lo, long hi)
将从 lo 到 hi 的下标之间的数据发布。
- DataProvider
数据提供者,只提供了根据下标位置获取数据。
- Cursored
游标,当前处理的下标。
- EventSink
数据 sink,主要是提供了丰富的publish方法。
- RingBufferPad、RingBufferFields
填充实现,主要解决“伪共享”
- RingBuffer
环形缓存区实现类,也是本文的绝对主角。
2.1 伪共享
在介绍RingBuffer的存储结构,就不得不先介绍CPU的缓存机制,在CPU中通常存在L1、L2、L3三级缓存,以前只有L1缓存是集成在CPU中,L2级缓存是集成在主板,随着制造工艺的提升,目前L1、L2、L3三级缓存都集成在CPU,如下图所示:
其中L1存储容量最小,但访问速度最快。CPU在执行指令时,优先从L1获取数据,如果缓存未命中,则依次访问L2、L3、最后访问主内存。
在计算机领域有一个非常著名的理论:局部性原理,在执行指令时访问到的数据,接下来80%的概率会访问到这条数据附近的数据。所以CPU在缓存数据时并不是一次只返回访问到的数据,而是会一次读取批数据(CPU一次缓存64字节数据),以读取数组为例进行阐述:
在到arrs[0]的时候,会将arrs[0]~arrs[7]这64个字节的数据,组成一个缓存行,这种机制极大的提高性能。
缓存行,但会造成“伪共享”的问题,当缓存行中一个数据发生变化,该缓存行将失效。
接下来结合环形队列为例来阐述一下伪共享。
关于队列,有两个重要的指针getIndex,writeIndex,基于cpu缓存机制,会将这些数据加载到一个缓存行,然后当一个线程更新getIndex值,另外一个线程更新writeIndex,这样任意一个线程对数据进行更新,其cpu中该缓存行就会失效,造成缓存未命中,缓存的优势也就随即消失,这就是所谓的伪共享。
解决伪共享的主要手段是填充,使用填充,我们来存在getIndex,writeIndex的梳理如下:
这样可以保证无论怎么将getIndex、writeIndex加载到CPU的缓存行时,可以保证一个缓存行只会包含getIndex或writeIndex,保证两个线程不会有更新竞争,确保缓存命中率,从而提升性能,这其实是典型的以空间换时间。
2.2 RingBuffer破解伪共享
在RingBuffer中环形队列在底层需要维护一个存储数组,如何确保将这些下标不要和其他变量不要缓存在一个cpu缓存行,通常的方案是在前后数组填充128个字节(这里没有想明白,不是只需要64个字节就可以了吗?),其代码实现截图如下:
上面有几个知识点:
-
UnSafe的arrayIndexScacle方法返回当前jvm中用来表示一个数组下标占用的字节数,64位操作系统开启了指针压缩将返回4,否则返回8,默认开启了指针压缩。
-
UnSafe的arrayBaseOffset可以获取数组的起始位置。
-
为了避免伪共享,用户申请bufferSize长度的数组,在内部会扩大其容量,在前后都会填充,这里在前后分别填充了128字节。
RingBuffer的内存布局如下图所示:
了解来数据存储结构后,接下来将分析RingBuffer的写入与读取,特别是探究多线程环境下如何实现无锁化。
3.1 多线程写入无锁化实现原理
在介绍写入数据之前我们先来看一段基于disruptor的写入模板代码:
上述的关键点如下:
-
通过调用RingBuffer的tryNext方法一个写入位置,如果当前没有可用位置供写入,则抛出队列已满异常。
-
通过调用RingBuffer指定下标位置的元素,供数据填充,RingBuffer引用对象池技术,避免发生GC。
-
数据填充完毕后通过调用RingBuffer的publish方法,通知消费方可使用。
-
如果遇到队列已满异常,等待片刻,再次尝试写入。
显而易见,通过调用tryNext方法非常重要,是整个数据写入的核心,故接下来探究该方法,进入RIngBuffer无锁化设计的核心。
RingBuffer的tryNext方法的实现逻辑如下:
可见,RingBuffer直接委托给Sequencer,那Sequencer又是何许人也呢?
3.1.1 Sequencer详解
Sequencer的核心类图如下图所示:
基本的行为主要由Sequenced基类定义,也是理解该类体系职责的关键窗口,Sequenced主要定义如下行为:
- int getBufferSize()
获取缓存区的容量
- boolean hasAvailableCapacity(int requiredCapacity)
判断当前缓存区是否有充足的容量
- long remainingCapacity()
当前剩余的容量
- long next()
获取下一个可写的序号,该值会超过bufferSize,与其进行取模得出底层数组中的下标
- long next(int n)
获取n个连续可写的位置,返回值为这批次最高的序号
- long tryNext() throws InsufficientCapacityException
尝试获取下一个可写的序号,如果当前无可写序号,抛出空间不足异常
- long tryNext(int n) throws InsufficientCapacityException
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)
最后
终极手撕架构师的学习笔记:分布式+微服务+开源框架+性能优化
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》,点击传送门即可获取!
es/e5c14a7895254671a72faed303032d36.jpg" alt=“img” style=“zoom: 33%;” />
最后
终极手撕架构师的学习笔记:分布式+微服务+开源框架+性能优化
[外链图片转存中…(img-uyCSm1qq-1712230368032)]
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》,点击传送门即可获取!
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)