Redis: 在项目中的应用-二、分布式缓存

时间:2024-04-20 13:20:37

1、缓存

  • 什么是缓存:缓存就是一种具备高效读写能力的数据暂存区域(称作Cache),是存储数据的临时地方,一般读写性能较高。

  • 缓存的作用

    • 降低后端负载。
    • 提高读写效率,降低响应时间。
    • 缓存内存的读写性能远高于磁盘,缓存可以大大降低用户方法并发量带来的服务器读写压力。
  • 缓存的成本

    • 数据一致性成本。
    • 代码维护成本。
    • 运维成本。
  • 如何使用缓存

    • 实际开发中,会构建多级缓存使得系统的运行速度进一步提升,例如本地缓存与redis缓存并发使用。
      在这里插入图片描述

      • 浏览器缓存:主要存在于浏览器端的缓存。
      • 应用层缓存:可以分为tomact本地缓存,比如map或者使用redis作为缓存。
      • 数据库缓存:在数据库中有一片空间buffer pool,增改查数据都会先加载到mysql的缓存中。
      • CPU缓存:当代计算机最大的问题是CPU性能提升了,但内存读写速度没有跟上,所以为了适应当下的情况,增加了CPU的L1、L2、L3级的缓存。
    • 缓存模型和思路
      标准的操作方法就是查询数据库之前先查询缓存,如果缓存数据存在,则直接从缓存中返回,如果缓存数据不存在,再查数据库,然后将数据存入redis。

2、缓存一致性问题解决方案(缓存更新策略)

(1)作用

缓存更新策略是缓存系统中的重要组成部分,用于确定何时以及如何更新缓存中的数据。

(2)三种策略

  • 内存淘汰:Redis自带的内存淘汰机制。
  • 过期淘汰:利用expire命令给数据设置过期时间。
  • 主动更新:主动完成数据库与缓存的同时更新。

总结:
在这里插入图片描述

(3)主动更新策略(数据库、缓存不一致解决方案)

  • Cache Aside Pattern

    • 由缓存的调用者,在更新数据库的同时更新缓存:
      • 一致性良好。
      • 实现难度一般。
    • 操作缓存和数据库时有三个问题需要考虑:
      • 删除缓存还是更新缓存
        • 更新缓存:每次更新数据库都更新缓存,无效写操作较多,并且存在较大的线程安全问题。
        • 删除缓存:更新数据库时让缓存失效,查询时再更新缓存,没有无效更新,线程安全问题相对较低。(可以解决双写问题)
      • 如何保证缓存与数据库的操作同时成功或失败
        • 单体系统:将缓存与数据库操作放在一个事务。
        • 分布式系统:利用TCC等分布式事务方案。
      • 先操作缓存还是先操作数据库
        • 先删除缓存,再操作数据库
          安全问题概率较高。
        • 先操作数据库,再删除缓存
          在满足原子性的情况下,安全问题概率较低。
  • Read/Write Through Pattern
    缓存与数据库整合为一个服务,由服务来维护一致性。调用者调用该服务,无需关心缓存一致性:

    • 一致性优秀。
    • 实现复杂。
    • 性能一般。
  • Write Behind Caching Pattern
    调用者只操作缓存,由其他线程异步的将缓存数据持久化到数据库,保证最终一致性。

    • 一致性差。
    • 性能好。
    • 实现复杂。
  • 缓存更新策略的最佳实践方案

    • 低一致性需求:使用Redis自带的内存淘汰机制。
    • 高一致性需求:主动更新,并以超时剔除作为兜底方案。
      • 读操作
        • 缓存命中则直接返回
        • 缓存未命中则查询数据库,并写入缓存,设定超时时间。
      • 写操作
        • 先写数据库,然后再删除缓存。
        • 要确保数据库与缓存操作的原子性。

3、缓存使用过程中产生的问题

(1)缓存穿透(缓存和数据库都不存在)

  • 产生原因
    缓存穿透是指客户端请求的数据在缓存中和数据库中都不存在,这样缓存永远不会生效,这些请求都会打到数据库。

  • 解决方案

    • 缓存空对象
      在这里插入图片描述
      • 思路:对于不存在的数据也在Redis建立缓存,值为空,并设置一个较短的TTL时间。
      • 优点:实现简单,维护方便
      • 缺点:额外的内存消耗;可能造成短期的不一致。
    • 布隆过滤器
      • 思路:利用布隆过滤算法,在请求进入Redis之前先判断是否存在,如果不存在则直接拒绝请求。
      • 优点:内存占用少,没有多余的key。
      • 缺点:实现复杂;存在误判的可能。
    • 其他
      • 做好数据的基础格式校验。
      • 加强用户权限校验。
      • 做好热点参数的限流。

(2)缓存击穿(热点key)

  • 产生原因

    • 热点key:
      • 在某段时间被高并发访问。
      • 缓存重建耗时较长。
    • 缓存击穿问题也叫热点key问题,就是一个被高并发访问并且缓存重建业务较复杂的key突然失效了,无数的请求访问会在瞬间给数据库带来巨大的冲击
    • 逻辑分析
      假设线程1在查询缓存之后,本来应该去查询数据库,然后把这个数据重新加载到缓存,此时只要线程1走完这个逻辑,其他线程就都能从缓存中加载这些数据,但是假设在线程1没有走完的时候,后续的线程2、线程3、线程4同时过来访问当前这个方法,那么这些线程都不能从缓存中查询到数据,那么他们就会同一时刻来访问查询缓存,都没有查到,接着同一时间去访问数据库,同时的去执行数据库代码,对数据库访问压力过大。
  • 解决方案

    • 互斥锁
      • 思路:给缓存重建过程加锁,确保重建过程只有一个线程执行,其他线程等待。因为锁能实现互斥性。假设线程过来,只能一个人一个人的来访问数据库,从而避免对于数据库访问压力过大,但这也会影响查询性能,因为此时会让查询性能从并行改成串行,我们可以采用tryLock方法+double check来解决这样的问题。假设现在线程1过来访问,他查询缓存没有命中,但是此时他获得到了锁资源,那么线程1就会一个人去执行逻辑,假设现在线程2过来,线程2在执行过程中,并没有获得到锁,那么线程了就可以进行休眠,休眠后再去查询缓存。

      • 实现逻辑
        在这里插入图片描述

      • 优点

        • 实现简单。
        • 没有额外内存消耗。
        • 一致性好。
      • 缺点

        • 保障了一致性,会存在不何用的情况。
        • 等待导致性能下降。
        • 有死锁的风险。
    • 逻辑过期
      • 思路

        • 热点key缓存永不过期,而是设置一个逻辑过期时间,查询到数据库时通过对逻辑过期时间判断,来决定是否需要重建缓存。我们之所以会出现这个缓存击穿问题,主要原因是在于我们对key设置了过期时间,假设我们不设置过期时间,其实就不会有缓存击穿的问题,但是不设置过期时间,这样数据不就一直占用我们内存了吗,我们可以采用逻辑过期方案。我们把过期时间设置在 redis的value中,注意:这个过期时间并不会直接作用于redis,而是我们后续通过逻辑去处理。假设线程1去查询缓存,然后从value中判断出来当前的数据已经过期了,此时线程1去获得互斥锁,那么其他线程会进行阻塞,获得了锁的线程他会开启一个 线程去进行 以前的重构数据的逻辑,直到新开的线程完成这个逻辑后,才释放锁, 而线程1直接进行返回,假设现在线程3过来访问,由于线程线程2持有着锁,所以线程3无法获得锁,线程3也直接返回数据,只有等到新开的线程2把重建数据构建完后,其他线程才能走返回正确的数据。
          这种方案巧妙在于,异步的构建缓存,缺点在于在构建完缓存之前,返回的都是脏数据。
        • 重建过程也通过互斥锁保证单线程执行
        • 重建缓存利用独立线程异步执行
        • 其他线程无需等待,直接查询到旧数据即可
      • 实现逻辑
        在这里插入图片描述

      • 优点
        线程无需等待,性能较好

      • 缺点
        保障了可用性,但会存在不一致的情况:不保证一致性、有额外内存消耗、实现复杂。

    • 对比
      在这里插入图片描述

(3)缓存雪崩

  • 产生原因:在同一时段大量的缓存key同时失效或者redis服务宕机,导致大量请求到达数据库,带来巨大压力。
    在这里插入图片描述

  • 解决方案

    • 给不同的key的TTL添加随机值。
    • 利用Redis集群提高服务的可用性。
    • 给缓存业务添加降级限流策略。
    • 给业务添加多级缓存。