Redis: 在项目中的应用-二、分布式缓存

1、缓存

什么是缓存：缓存就是一种具备高效读写能力的数据暂存区域（称作Cache），是存储数据的临时地方，一般读写性能较高。
缓存的作用：
- 降低后端负载。
- 提高读写效率，降低响应时间。
- 缓存内存的读写性能远高于磁盘，缓存可以大大降低用户方法并发量带来的服务器读写压力。
缓存的成本
- 数据一致性成本。
- 代码维护成本。
- 运维成本。
如何使用缓存
- 实际开发中，会构建多级缓存使得系统的运行速度进一步提升，例如本地缓存与redis缓存并发使用。
  - 浏览器缓存：主要存在于浏览器端的缓存。
  - 应用层缓存：可以分为tomact本地缓存，比如map或者使用redis作为缓存。
  - 数据库缓存：在数据库中有一片空间buffer pool，增改查数据都会先加载到mysql的缓存中。
  - CPU缓存：当代计算机最大的问题是CPU性能提升了，但内存读写速度没有跟上，所以为了适应当下的情况，增加了CPU的L1、L2、L3级的缓存。
- 缓存模型和思路
  标准的操作方法就是查询数据库之前先查询缓存，如果缓存数据存在，则直接从缓存中返回，如果缓存数据不存在，再查数据库，然后将数据存入redis。

2、缓存一致性问题解决方案（缓存更新策略）

（1）作用

缓存更新策略是缓存系统中的重要组成部分，用于确定何时以及如何更新缓存中的数据。

（2）三种策略

内存淘汰：Redis自带的内存淘汰机制。
过期淘汰：利用expire命令给数据设置过期时间。
主动更新：主动完成数据库与缓存的同时更新。

总结：
在这里插入图片描述

（3）主动更新策略（数据库、缓存不一致解决方案）

Cache Aside Pattern
- 由缓存的调用者，在更新数据库的同时更新缓存：
  - 一致性良好。
  - 实现难度一般。
- 操作缓存和数据库时有三个问题需要考虑：
  - 删除缓存还是更新缓存
    - 更新缓存：每次更新数据库都更新缓存，无效写操作较多，并且存在较大的线程安全问题。
    - 删除缓存：更新数据库时让缓存失效，查询时再更新缓存，没有无效更新，线程安全问题相对较低。（可以解决双写问题）
  - 如何保证缓存与数据库的操作同时成功或失败
    - 单体系统：将缓存与数据库操作放在一个事务。
    - 分布式系统：利用TCC等分布式事务方案。
  - 先操作缓存还是先操作数据库
    - 先删除缓存，再操作数据库
      安全问题概率较高。
    - 先操作数据库，再删除缓存
      在满足原子性的情况下，安全问题概率较低。
Read/Write Through Pattern
缓存与数据库整合为一个服务，由服务来维护一致性。调用者调用该服务，无需关心缓存一致性：
- 一致性优秀。
- 实现复杂。
- 性能一般。
Write Behind Caching Pattern
调用者只操作缓存，由其他线程异步的将缓存数据持久化到数据库，保证最终一致性。
- 一致性差。
- 性能好。
- 实现复杂。
缓存更新策略的最佳实践方案
- 低一致性需求：使用Redis自带的内存淘汰机制。
- 高一致性需求：主动更新，并以超时剔除作为兜底方案。
  - 读操作
    - 缓存命中则直接返回
    - 缓存未命中则查询数据库，并写入缓存，设定超时时间。
  - 写操作
    - 先写数据库，然后再删除缓存。
    - 要确保数据库与缓存操作的原子性。

3、缓存使用过程中产生的问题

（1）缓存穿透（缓存和数据库都不存在）

产生原因
缓存穿透是指客户端请求的数据在缓存中和数据库中都不存在，这样缓存永远不会生效，这些请求都会打到数据库。
解决方案
- 缓存空对象
  - 思路：对于不存在的数据也在Redis建立缓存，值为空，并设置一个较短的TTL时间。
  - 优点：实现简单，维护方便
  - 缺点：额外的内存消耗；可能造成短期的不一致。
- 布隆过滤器
  - 思路：利用布隆过滤算法，在请求进入Redis之前先判断是否存在，如果不存在则直接拒绝请求。
  - 优点：内存占用少，没有多余的key。
  - 缺点：实现复杂；存在误判的可能。
- 其他
  - 做好数据的基础格式校验。
  - 加强用户权限校验。
  - 做好热点参数的限流。

（2）缓存击穿（热点key）

产生原因
- 热点key:
  - 在某段时间被高并发访问。
  - 缓存重建耗时较长。
- 缓存击穿问题也叫热点key问题，就是一个被高并发访问并且缓存重建业务较复杂的key突然失效了，无数的请求访问会在瞬间给数据库带来巨大的冲击
- 逻辑分析
  假设线程1在查询缓存之后，本来应该去查询数据库，然后把这个数据重新加载到缓存，此时只要线程1走完这个逻辑，其他线程就都能从缓存中加载这些数据，但是假设在线程1没有走完的时候，后续的线程2、线程3、线程4同时过来访问当前这个方法，那么这些线程都不能从缓存中查询到数据，那么他们就会同一时刻来访问查询缓存，都没有查到，接着同一时间去访问数据库，同时的去执行数据库代码，对数据库访问压力过大。
解决方案
- 互斥锁
  - 思路：给缓存重建过程加锁，确保重建过程只有一个线程执行，其他线程等待。因为锁能实现互斥性。假设线程过来，只能一个人一个人的来访问数据库，从而避免对于数据库访问压力过大，但这也会影响查询性能，因为此时会让查询性能从并行改成串行，我们可以采用tryLock方法+double check来解决这样的问题。假设现在线程1过来访问，他查询缓存没有命中，但是此时他获得到了锁资源，那么线程1就会一个人去执行逻辑，假设现在线程2过来，线程2在执行过程中，并没有获得到锁，那么线程了就可以进行休眠，休眠后再去查询缓存。
  - 实现逻辑
  - 优点
    - 实现简单。
    - 没有额外内存消耗。
    - 一致性好。
  - 缺点
    - 保障了一致性，会存在不何用的情况。
    - 等待导致性能下降。
    - 有死锁的风险。
- 逻辑过期
  - 思路
    - 热点key缓存永不过期，而是设置一个逻辑过期时间，查询到数据库时通过对逻辑过期时间判断，来决定是否需要重建缓存。我们之所以会出现这个缓存击穿问题，主要原因是在于我们对key设置了过期时间，假设我们不设置过期时间，其实就不会有缓存击穿的问题，但是不设置过期时间，这样数据不就一直占用我们内存了吗，我们可以采用逻辑过期方案。我们把过期时间设置在 redis的value中，注意：这个过期时间并不会直接作用于redis，而是我们后续通过逻辑去处理。假设线程1去查询缓存，然后从value中判断出来当前的数据已经过期了，此时线程1去获得互斥锁，那么其他线程会进行阻塞，获得了锁的线程他会开启一个线程去进行以前的重构数据的逻辑，直到新开的线程完成这个逻辑后，才释放锁，而线程1直接进行返回，假设现在线程3过来访问，由于线程线程2持有着锁，所以线程3无法获得锁，线程3也直接返回数据，只有等到新开的线程2把重建数据构建完后，其他线程才能走返回正确的数据。
      这种方案巧妙在于，异步的构建缓存，缺点在于在构建完缓存之前，返回的都是脏数据。
    - 重建过程也通过互斥锁保证单线程执行
    - 重建缓存利用独立线程异步执行
    - 其他线程无需等待，直接查询到旧数据即可
  - 实现逻辑
  - 优点
    线程无需等待，性能较好
  - 缺点
    保障了可用性，但会存在不一致的情况：不保证一致性、有额外内存消耗、实现复杂。
- 对比

（3）缓存雪崩

产生原因：在同一时段大量的缓存key同时失效或者redis服务宕机，导致大量请求到达数据库，带来巨大压力。
解决方案：
- 给不同的key的TTL添加随机值。
- 利用Redis集群提高服务的可用性。
- 给缓存业务添加降级限流策略。
- 给业务添加多级缓存。

秒客网

Redis: 在项目中的应用-二、分布式缓存

1、缓存

2、缓存一致性问题解决方案（缓存更新策略）

（1）作用

（2）三种策略

（3）主动更新策略（数据库、缓存不一致解决方案）

3、缓存使用过程中产生的问题

（1）缓存穿透（缓存和数据库都不存在）

（2）缓存击穿（热点key）

（3）缓存雪崩

相关文章