Redis处理高并发之布隆过滤器详解
收藏
本篇文章给大家分享《Redis处理高并发之布隆过滤器详解》,覆盖了数据库的常见基础知识,其实一个语言的全部知识点一篇文章是不可能说完的,但希望通过这些问题,让读者对自己的掌握程度有一定的认识(B 数),从而弥补自己的不足,更好的掌握它。
缓存穿透、击穿、雪崩
首先我们从缓存会出现的几种问题,来进行分析,在高并发的场景下如果出现这种情况,我们应该如何解决。
正常情况下,我们的web应用会先去请求缓存服务,如果缓存命中,那么就去拿缓存里面的数据,返回结果给应用,
缓存穿透
缓存穿透与缓存雪崩和缓存击穿还是不一样的,雪崩和击穿的情况下,数据库的数据都是真正常的,可以去请求数据库获取数据,只是缓存层出现问题,等待缓存恢复了,就会减轻数据库的压力。 而缓存透不一样的就是,缓存和数据库都没有要请求的数据,大量的请求来了,数据库的压力很大。
出现情况
- 数据库数据被大量清除,导致访问不到
- 黑客恶意攻击
常见的解决方案
- redis缓存空值,请求不到的时候返回给应用空值。
- 使用布隆过滤器,把数据库的一部分数据hash到布隆过滤器里,在请求数据库之前先去布隆过滤器里筛选到一部分请求,判断数据是否存在,避免直接去访问数据库。
缓存击穿
出现情况
- 大量热点数据库过期,导致无法从缓存获取到数据,大量请求数据库也无法返回书就
解决方案
- 加锁,保证同一时间内,只允许有一个线程去更新缓存,等锁释放后在重新去请求缓存。
- 热点数据不去设置过期时间,如果要设置过期时间,在过期的时候通知后台去更新缓存的过期时间。
缓存雪崩
- 大量缓存在同一时间失效,导致大量请求进入数据库
- redis故障宕机,导致缓存不能使用。
解决方案
- 同上加锁
- 给缓存的过期时间加入随机数,保证缓存不会在同一时间同时失效。
- 副本key策略,就是对于一个key,在它的基础上在设置一个key,它们的value都是一样的,只不过一个设置过期时间、一个不设置过期时间,相当于给key做了个副本,只不过在更新缓存的时候,副本key也是要更新的,避免出现数据不一致的现象。
布隆过滤器 Bloom filter
前面提到过布隆过滤器在请求比较高的时候,可以帮助我们抵挡一部分请求,从而减轻数据库的压力,布隆过滤器的数据结构是一个二进制的bit向量,或者说是一个bit数组,它相对于list、set、map这些集合,它占用的空间更少,不足之处处就是返回的结果会有一定概率的误差。
public static void main(String[] args) { int size = 1_000_000; BloomFilter bloomFilter = BloomFilter.create(Funnels.integerFunnel(), size); for (int i = 0; i list = new ArrayList(1000); for (int i = size + 10000; i确实有误差的数量,但是误差量不大,追求效率的同时只是牺牲一点误差了。
总结
加锁的排队的场景确实能帮助我们很好的解决缓存穿透、击穿的一些问题,但是效率也是非常低了,因为每个请求都是排队等待,如果可以接受轻微误差的话,布隆过滤器的确是个很不错的选择,Bloom filter的bitmap的存储效率确实很高。