Redis缓存:淘汰机制,2021最新Java常用开源库总结
*Read-Throug模式*Write-Through模式异步:有数据丢失风险,其侧重于提供低延迟访问Write-Behind模式Cache Aside模式查询数据先从缓存读取数据,如果缓存中不存在,则再到数据库中读取数据,获取到数据之后更新到缓存Cache中,但更新数据操作,会先去更新数据库种的数据,然后将缓存种的数据失效。而且Cache Aside模式会存在并发风险:执行读操作未命中缓存,然
* Read-Throug模式
* Write-Through模式
-
异步:有数据丢失风险,其侧重于提供低延迟访问
- Write-Behind模式
Cache Aside模式
查询数据先从缓存读取数据,如果缓存中不存在,则再到数据库中读取数据,获取到数据之后更新到缓存Cache中,但更新数据操作,会先去更新数据库种的数据,然后将缓存种的数据失效。
而且Cache Aside模式会存在并发风险:执行读操作未命中缓存,然后查询数据库中取数据,数据已经查询到还没放入缓存,同时一个更新写操作让缓存失效,然后读操作再把查询到数据加载缓存,导致缓存的脏数据。
Read/Write-Throug模式
查询数据和更新数据都直接访问缓存服务,缓存服务同步方式地将数据更新到数据库。出现脏数据的概率较低,但是就强依赖缓存,对缓存服务的稳定性有较大要求,但同步更新会导致其性能不好。
Write Behind模式
查询数据和更新数据都直接访问缓存服务,但缓存服务使用异步方式地将数据更新到数据库(通过异步任务) 速度快,效率会非常高,但是数据的一致性比较差,还可能会有数据的丢失情况,实现逻辑也较为复杂。
在实际项目开发中根据实际的业务场景需求来进行选择缓存模式。那了解上述后,我们的应用中为什么需要使用到redis缓存呢?
在应用使用Redis缓存可以提高系统性能和并发,主要体现在
- 高性能:基于内存查询,KV结构,简单逻辑运算
- 高并发: Mysql 每秒只能支持2000左右的请求,Redis轻松每秒1W以上。让80%以上查询走缓存,20%以下查询走数据库,能让系统吞吐量有很大的提高
虽然使用Redis缓存可以大大提升系统的性能,但是使用了缓存,会出现一些问题,比如,缓存与数据库双向不一致、缓存雪崩等,对于出现的这些问题该怎么解决呢?
使用缓存常见的问题
使用了缓存,会出现一些问题,主要体现在:
- 缓存与数据库双写不一致
- 缓存雪崩: Redis 缓存无法处理大量的应用请求,转移到数据库层导致数据库层的压力激增;
- 缓存穿透:访问数据不存在在Redis缓存中和数据库中,导致大量访问穿透缓存直接转移到数据库导致数据库层的压力激增;
- 缓存击穿:缓存无法处理高频热点数据,导致直接高频访问数据库导致数据库层的压力激增;
缓存与数据库数据不一致
只读缓存(Cache Aside模式)
对于只读缓存(Cache Aside模式), 读操作都发生在缓存中,数据不一致只会发生在删改操作上(新增操作不会,因为新增只会在数据库处理),当发生删改操作时,缓存将数据中标志为无效和更新数据库 。因此在更新数据库和删除缓存值的过程中,无论这两个操作的执行顺序谁先谁后,只要有一个操作失败了就会出现数据不一致的情况。
总结出,当不存在并发的情况使用重试机制(消息队列使用),当存在高并发的情况,使用延迟双删除(在第一次删除后,睡眠一定时间后,再进行删除),具体如下:
操作顺序 | 是否高并发 | 潜在问题 | 现象 | 应对方案 |
---|---|---|---|---|
先删除缓存,再更新数据库 | 否 | 缓存删除成功,数据库更新失败 | 读到数据库的旧值 | 重试机制(数据库更新) |
先更新数据库,再删除缓存 | 否 | 数据库更新成功,缓存删除失败 | 读到缓存的旧值 | 重试机制(缓存删除) |
先删除缓存,再更新数据库 | 是 | 缓存删除后,尚未更新数据库,有并发读请求 | 并发读请求读到数据库旧值,并更新到缓存,导致之后的读请求读到旧值 | 延迟双删() |
先更新数据库,再删除缓存 | 是 | 数据库更新成功,尚未删除缓存 | 读到缓存的旧值 | 不一致的情况短暂存在,对业务影响较小 |
NOTE:
延迟双删除伪代码:
redis.delKey(X)
db.update(X)
Thread.sleep(N)
redis.delKey(X)
读写缓存(Read/Write-Throug、Write Behind模式 )
对于读写缓存,写操作都发生在缓存中,后再更新数据库,只要有一个操作失败了就会出现数据不一致的情况。
总结出,当不存在并发的情况使用重试机制(消息队列使用),当存在高并发的情况,使用分布锁。具体如下:
操作顺序 | 是否高 并发 | 潜在问题 | 现象 | 应对方案 |
---|---|---|---|---|
先更新缓存,再更新数据库 | 否 | 缓存更新成功,数据库更新失败 | 会从缓存中读到最新值,短期影响不大 | 重试机制(数据库更新) |
先更新数据库,再更新缓存 | 否 | 数据库更新成功,缓存更新失败 | 会从缓存读到旧值 | 重试机制(缓存删除) |
先更新数据库,再更新缓存 | 写+读并发 | 线程A先更新数据库,之后线程B读取数据,之后线程A更新缓存 | B会命中缓存,读取到旧值 | A更新缓存前,对业务有短暂影响 |
先更新缓存,再更新数据库 | 写+读并发 | 线程A先更新缓存成功,之后线程B读取数据,此时线程B命中缓存,读取到最新值后返回,之后线程A更新数据库成功 | B会命中缓存,读取到最新值 | 业务没影响 |
先更新数据库,再更新缓存 | 写+写并发 | 线程A和线程B同时更新同一条数据,更新数据库的顺序是先A后B,但更新缓存时顺序是先B后A,这会导致数据库和缓存的不一致 | 数据库和缓存的不一致 | 写操作加分布式锁 |
先更新缓存,再更新数据库 | 写+写并发 | 线程A和线程B同时更新同一条数据,更新缓存的顺序是先A后B,但是更新数据库的顺序是先B后A,这也会导致数据库和缓存的不一致 | 数据库和缓存的不一致 | 写操作加分布式锁 |
缓存雪崩
缓存雪崩,由于缓存中有大量数据同时过期失效或者缓存出现宕机,大量的应用请求无法在 Redis 缓存中进行处理,进而发送到数据库层导致数据库层的压力激增,严重的会造成数据库宕机。
对于缓存中有大量数据同时过期,导致大量请求无法得到处理, 解决方式:
- 数据预热,将发生大并发访问前手动触发加载缓存不同的key, 可以避免在用户请求的时候,先查询数据库
- 设置不同的过期时间,让缓存失效的时间点尽量均匀
- 双层缓存策略, 在原始缓存上加上拷贝缓存,原始缓存失效时可以访问拷贝缓存,且原始缓存失效时间设置为短期,拷贝缓存设置为长期
- 服务降级 , 发生缓存雪崩时,针对不同的数据采取不同的降级方案 ,比如,非核心数据直接返回预定义信息、空值或是错误信息
对于缓存出现宕机,解决方式:
- 业务系统中实现服务熔断或请求限流机制,防止大量访问导致数据库出现宕机
缓存穿透
缓存穿透,数据在数据库和缓存中都不存在,这样就导致查询数据,在缓存中找不到对应key的value,都要去数据库再查询一遍,然后返回空(相当于进行了两次无用的查询)。
当有大量访问请求,且其绕过缓存直接查数据库,导致数据库层的压力激增,严重的会造成数据库宕机。
对于缓存穿透,解决方式:
- 缓存空值或缺省值,当一个查询返回的数据为空时, 空结果也将进行缓存,并将它的过期时间设置比较短,下次访问直接从缓存中取值,避免了把大量请求发送给数据库处理,造成数据库出问题。
- 布隆过滤器( BloomFilter ),将所有可能查询数据key哈希到一个足够大的bitmap中 , 在查询的时候先去BloomFilter去查询key是否存在,如果不存在就直接返回,存在再去查询缓存,缓存中没有再去查询数据库 ,从而避免了数据库层的压力激增出现宕机。
缓存击穿
缓存击穿,针对某个访问非常频繁的热点数据过期失效,导致访问无法在缓存中进行处理,进而会有导致大量的直接请求数据库,从而使得数据库层的压力激增,严重的会造成数据库宕机。
对于缓存击穿,解决方式:
- 不设置过期时间,对于访问特别频繁的热点数据,不设置过期时间。
总结
在大多数业务场景下,Redis缓存作为只读缓存使用。针对只读缓存来说, 优先使用先更新数据库再删除缓存的方法保证数据一致性 。
其中,缓存雪崩,缓存穿透,缓存击穿三大问题的原因和解决方式
最后
由于文案过于长,在此就不一一介绍了,这份Java后端架构进阶笔记内容包括:Java集合,JVM、Java并发、微服务、SpringNetty与 RPC 、网络、日志 、Zookeeper 、Kafka 、RabbitMQ 、Hbase 、MongoDB、Cassandra 、Java基础、负载均衡、数据库、一致性算法、Java算法、数据结构、分布式缓存等等知识详解。
本知识体系适合于所有Java程序员学习,关于以上目录中的知识点都有详细的讲解及介绍,掌握该知识点的所有内容对你会有一个质的提升,其中也总结了很多面试过程中遇到的题目以及有对应的视频解析总结。
有需要的朋友可以点击这里免费获取
目以及有对应的视频解析总结。**
有需要的朋友可以点击这里免费获取
[外链图片转存中…(img-TXH6VR0E-1630069272153)]
更多推荐
所有评论(0)