系统教程 · 2024年7月7日

Redis中Bloomfilter布隆过滤器的学习

Redis中Bloomfilter布隆过滤器的学习

收藏

在数据库实战开发的过程中,我们经常会遇到一些这样那样的问题,然后要卡好半天,等问题解决了才发现原来一些细节知识点还是没有掌握好。今天golang学习网就整理分享《Redis中Bloomfilter布隆过滤器的学习》,聊聊布隆过滤器、RedisBloom、filter,希望可以帮助到正在努力赚钱的你。

1.概念

​ 布隆过滤器是一个高空间利用率的概率性数据结构,主要目的是节省内存空间以及判断一个元素是否存在于一个集合中(存在误判的情况),可以理解为一个不怎么精确的 set 结构,当你使用它的 contains 方法判断某个对象是否存在时,它可能会误判。但是布隆过滤器也不是特别不精确,只要参数设置的合理,它的精确度可以控制的相对足够精确,只会有小小的误判概率(控制参数:error_rate-误判率 initial_size-初始容量)

​ error_rate越小,越精确,需要的空间越大

​ initial_size越大,越精确,当实际数量超出这个数值时,误判率会上升

布隆过滤器可以判断某个数据一定不存在,但是无法判断一定存在

2.guava实现

2.1.依赖

   

   
    
     com.google.guava
    
    
     guava
    
    
     19.0
    
   

2.2.初始化布隆过滤器

//初始化布隆过滤器,放入到spring容器里面
@Bean
public MyBloomFilter
   
     initBloomFilterHelper() {
    return new MyBloomFilter((Funnel
    
     ) (from, into) -> into.putString(from, Charsets.UTF_8).putString(from, Charsets.UTF_8) , 1000000, 0.01); }
    
   

2.3.布隆过滤器

package com.qin.redis.bloomfilter;
import com.google.common.base.Preconditions;
import com.google.common.hash.Funnel;
import com.google.common.hash.Hashing;
/**
 * @version: V1.0.0
 * @className: MyBloomFilter
 */
public class MyBloomFilter
   
     {
    private int numHashFunctions;
    private int bitSize;
    private Funnel
    
      funnel; public MyBloomFilter(Funnel
     
       funnel, int expectedInsertions, double fpp) { Preconditions.checkArgument(funnel != null, "funnel不能为空"); this.funnel = funnel; // 计算bit数组长度 bitSize = optimalNumOfBits(expectedInsertions, fpp); // 计算hash方法执行次数 numHashFunctions = optimalNumOfHashFunctions(expectedInsertions, bitSize); } public int[] murmurHashOffset(T value) { int[] offset = new int[numHashFunctions]; long hash64 = Hashing.murmur3_128().hashObject(value, funnel).asLong(); int hash1 = (int) hash64; int hash2 = (int) (hash64 >>> 32); for (int i = 1; i 
      

2.4.添加元素或者判断是否存在

package com.qin.redis.bloomfilter.service;
import com.google.common.base.Preconditions;
import com.hikvison.aksk.redis.bloomfilter.MyBloomFilter;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.redis.core.RedisTemplate;
import org.springframework.stereotype.Service;
/**
 * @version: V1.0.0
 * @className: RedisBloomFilterService
 */
@Service
public class RedisBloomFilterService {
    @Autowired
    private RedisTemplate redisTemplate;
    /**
     * 根据给定的布隆过滤器添加值
     */
    public 
       
         void addByBloomFilter(MyBloomFilter
        
          bloomFilterHelper, String key, T value) { Preconditions.checkArgument(bloomFilterHelper != null, "myBloomFilter不能为空"); int[] offset = bloomFilterHelper.murmurHashOffset(value); for (int i : offset) { System.out.println("key : " + key + " " + "value : " + i); redisTemplate.opsForValue().setBit(key, i, true); } } /** * 根据给定的布隆过滤器判断值是否存在 */ public 
         
           boolean includeByBloomFilter(MyBloomFilter
          
            bloomFilterHelper, String key, T value) { Preconditions.checkArgument(bloomFilterHelper != null, "myBloomFilter不能为空"); int[] offset = bloomFilterHelper.murmurHashOffset(value); for (int i : offset) { System.out.println("key : " + key + " " + "value : " + i); if (!redisTemplate.opsForValue().getBit(key, i)) { return false; } } return true; } }
          
         
        
       

3.Redisson实现

3.1.依赖

       
        
         org.redisson
        
        
         redisson
        
        
         2.7.0
        
       

3.2.注入或测试

 //单机模式:可以设置集群、哨兵模式
    @Bean
    public Redisson redisson() {
        Config config = new Config();
        config.useSingleServer().setAddress("redis://127.0.0.1:6379");
        RedissonClient redissonClient = Redisson.create(config);
        //初始化过滤器
        RBloomFilter bloomFilter = redissonClient.getBloomFilter("testBloomFilter");
        bloomFilter.tryInit(1000000L,0.05);
        //插入元素
        bloomFilter.add("zhangsan");
        bloomFilter.add("lisi");
        //判断元素是否存在
        boolean flag = bloomFilter.contains("lisi");
        return (Redisson) redissonClient;
    }