1、缓存
-
什么是缓存:缓存就是一种具备高效读写能力的数据暂存区域(称作Cache),是存储数据的临时地方,一般读写性能较高。
-
缓存的作用:
- 降低后端负载。
- 提高读写效率,降低响应时间。
- 缓存内存的读写性能远高于磁盘,缓存可以大大降低用户方法并发量带来的服务器读写压力。
-
缓存的成本
- 数据一致性成本。
- 代码维护成本。
- 运维成本。
-
如何使用缓存
-
实际开发中,会构建多级缓存使得系统的运行速度进一步提升,例如本地缓存与redis缓存并发使用。
- 浏览器缓存:主要存在于浏览器端的缓存。
- 应用层缓存:可以分为tomact本地缓存,比如map或者使用redis作为缓存。
- 数据库缓存:在数据库中有一片空间buffer pool,增改查数据都会先加载到mysql的缓存中。
- CPU缓存:当代计算机最大的问题是CPU性能提升了,但内存读写速度没有跟上,所以为了适应当下的情况,增加了CPU的L1、L2、L3级的缓存。
-
缓存模型和思路
标准的操作方法就是查询数据库之前先查询缓存,如果缓存数据存在,则直接从缓存中返回,如果缓存数据不存在,再查数据库,然后将数据存入redis。
-
2、缓存一致性问题解决方案(缓存更新策略)
(1)作用
缓存更新策略是缓存系统中的重要组成部分,用于确定何时以及如何更新缓存中的数据。
(2)三种策略
- 内存淘汰:Redis自带的内存淘汰机制。
- 过期淘汰:利用expire命令给数据设置过期时间。
- 主动更新:主动完成数据库与缓存的同时更新。
总结:
(3)主动更新策略(数据库、缓存不一致解决方案)
-
Cache Aside Pattern
- 由缓存的调用者,在更新数据库的同时更新缓存:
- 一致性良好。
- 实现难度一般。
- 操作缓存和数据库时有三个问题需要考虑:
- 删除缓存还是更新缓存
- 更新缓存:每次更新数据库都更新缓存,无效写操作较多,并且存在较大的线程安全问题。
- 删除缓存:更新数据库时让缓存失效,查询时再更新缓存,没有无效更新,线程安全问题相对较低。(可以解决双写问题)
- 如何保证缓存与数据库的操作同时成功或失败
- 单体系统:将缓存与数据库操作放在一个事务。
- 分布式系统:利用TCC等分布式事务方案。
- 先操作缓存还是先操作数据库
- 先删除缓存,再操作数据库
安全问题概率较高。 - 先操作数据库,再删除缓存
在满足原子性的情况下,安全问题概率较低。
- 先删除缓存,再操作数据库
- 删除缓存还是更新缓存
- 由缓存的调用者,在更新数据库的同时更新缓存:
-
Read/Write Through Pattern
缓存与数据库整合为一个服务,由服务来维护一致性。调用者调用该服务,无需关心缓存一致性:- 一致性优秀。
- 实现复杂。
- 性能一般。
-
Write Behind Caching Pattern
调用者只操作缓存,由其他线程异步的将缓存数据持久化到数据库,保证最终一致性。- 一致性差。
- 性能好。
- 实现复杂。
-
缓存更新策略的最佳实践方案
- 低一致性需求:使用Redis自带的内存淘汰机制。
-
高一致性需求:主动更新,并以超时剔除作为兜底方案。
-
读操作
- 缓存命中则直接返回
- 缓存未命中则查询数据库,并写入缓存,设定超时时间。
- 写操作
- 先写数据库,然后再删除缓存。
- 要确保数据库与缓存操作的原子性。
-
读操作
3、缓存使用过程中产生的问题
(1)缓存穿透(缓存和数据库都不存在)
-
产生原因
缓存穿透是指客户端请求的数据在缓存中和数据库中都不存在,这样缓存永远不会生效,这些请求都会打到数据库。 -
解决方案
-
缓存空对象
- 思路:对于不存在的数据也在Redis建立缓存,值为空,并设置一个较短的TTL时间。
- 优点:实现简单,维护方便
- 缺点:额外的内存消耗;可能造成短期的不一致。
-
布隆过滤器
- 思路:利用布隆过滤算法,在请求进入Redis之前先判断是否存在,如果不存在则直接拒绝请求。
- 优点:内存占用少,没有多余的key。
- 缺点:实现复杂;存在误判的可能。
-
其他
- 做好数据的基础格式校验。
- 加强用户权限校验。
- 做好热点参数的限流。
-
缓存空对象
(2)缓存击穿(热点key)
-
产生原因
-
热点key:
- 在某段时间被高并发访问。
- 缓存重建耗时较长。
- 缓存击穿问题也叫热点key问题,就是一个被高并发访问并且缓存重建业务较复杂的key突然失效了,无数的请求访问会在瞬间给数据库带来巨大的冲击
- 逻辑分析
假设线程1在查询缓存之后,本来应该去查询数据库,然后把这个数据重新加载到缓存,此时只要线程1走完这个逻辑,其他线程就都能从缓存中加载这些数据,但是假设在线程1没有走完的时候,后续的线程2、线程3、线程4同时过来访问当前这个方法,那么这些线程都不能从缓存中查询到数据,那么他们就会同一时刻来访问查询缓存,都没有查到,接着同一时间去访问数据库,同时的去执行数据库代码,对数据库访问压力过大。
-
热点key:
-
解决方案
-
互斥锁
-
思路:给缓存重建过程加锁,确保重建过程只有一个线程执行,其他线程等待。因为锁能实现互斥性。假设线程过来,只能一个人一个人的来访问数据库,从而避免对于数据库访问压力过大,但这也会影响查询性能,因为此时会让查询性能从并行改成串行,我们可以采用tryLock方法+double check来解决这样的问题。假设现在线程1过来访问,他查询缓存没有命中,但是此时他获得到了锁资源,那么线程1就会一个人去执行逻辑,假设现在线程2过来,线程2在执行过程中,并没有获得到锁,那么线程了就可以进行休眠,休眠后再去查询缓存。
-
实现逻辑
-
优点
- 实现简单。
- 没有额外内存消耗。
- 一致性好。
-
缺点
- 保障了一致性,会存在不何用的情况。
- 等待导致性能下降。
- 有死锁的风险。
-
-
逻辑过期
-
思路
- 热点key缓存永不过期,而是设置一个逻辑过期时间,查询到数据库时通过对逻辑过期时间判断,来决定是否需要重建缓存。我们之所以会出现这个缓存击穿问题,主要原因是在于我们对key设置了过期时间,假设我们不设置过期时间,其实就不会有缓存击穿的问题,但是不设置过期时间,这样数据不就一直占用我们内存了吗,我们可以采用逻辑过期方案。我们把过期时间设置在 redis的value中,注意:这个过期时间并不会直接作用于redis,而是我们后续通过逻辑去处理。假设线程1去查询缓存,然后从value中判断出来当前的数据已经过期了,此时线程1去获得互斥锁,那么其他线程会进行阻塞,获得了锁的线程他会开启一个 线程去进行 以前的重构数据的逻辑,直到新开的线程完成这个逻辑后,才释放锁, 而线程1直接进行返回,假设现在线程3过来访问,由于线程线程2持有着锁,所以线程3无法获得锁,线程3也直接返回数据,只有等到新开的线程2把重建数据构建完后,其他线程才能走返回正确的数据。
这种方案巧妙在于,异步的构建缓存,缺点在于在构建完缓存之前,返回的都是脏数据。 - 重建过程也通过互斥锁保证单线程执行
- 重建缓存利用独立线程异步执行
- 其他线程无需等待,直接查询到旧数据即可
- 热点key缓存永不过期,而是设置一个逻辑过期时间,查询到数据库时通过对逻辑过期时间判断,来决定是否需要重建缓存。我们之所以会出现这个缓存击穿问题,主要原因是在于我们对key设置了过期时间,假设我们不设置过期时间,其实就不会有缓存击穿的问题,但是不设置过期时间,这样数据不就一直占用我们内存了吗,我们可以采用逻辑过期方案。我们把过期时间设置在 redis的value中,注意:这个过期时间并不会直接作用于redis,而是我们后续通过逻辑去处理。假设线程1去查询缓存,然后从value中判断出来当前的数据已经过期了,此时线程1去获得互斥锁,那么其他线程会进行阻塞,获得了锁的线程他会开启一个 线程去进行 以前的重构数据的逻辑,直到新开的线程完成这个逻辑后,才释放锁, 而线程1直接进行返回,假设现在线程3过来访问,由于线程线程2持有着锁,所以线程3无法获得锁,线程3也直接返回数据,只有等到新开的线程2把重建数据构建完后,其他线程才能走返回正确的数据。
-
实现逻辑
-
优点
线程无需等待,性能较好 -
缺点
保障了可用性,但会存在不一致的情况:不保证一致性、有额外内存消耗、实现复杂。
-
-
对比
-
互斥锁
(3)缓存雪崩
-
产生原因:在同一时段大量的缓存key同时失效或者redis服务宕机,导致大量请求到达数据库,带来巨大压力。
-
解决方案:
- 给不同的key的TTL添加随机值。
- 利用Redis集群提高服务的可用性。
- 给缓存业务添加降级限流策略。
- 给业务添加多级缓存。