文件名称:布隆过滤器(利用布隆过滤器实现文字的嵌入和查找功能)
文件大小:9.14MB
文件格式:ZIP
更新时间:2022-09-04 09:32:02
布隆过滤器 数据结构 c++ 内存优化 数据的插入和查询
布隆过滤器,大家学过数据结构的应该都清楚,一般的字典树要实现嵌入和查找都内存的消耗非常大,布隆过滤器有BloomFilter<1000000,string, BKDRHash, APHash, DJBHash> bf五个参数你要查找的元素个数,查找元素类型,三个Hash函数, m = -n*ln(p) / (ln(2)^2) k = m/n * ln(2) # k 为哈希函数个数 # m 为布隆过滤器长度 # n 为插入的元素个数 # p 为可接受该容器的误报率(0-1) 当k等于3时,m=4.36n,于是可以设置m/n=5,k如果多的话,m/n可以设置更大来追求准确率,一般m/n设置为k*ln(2)就行,此时误差率小于0.01
【文件预览】:
bloom
----input.gbk.dat(8.06MB)
----as_result.txt(12.38MB)
----main.cpp(2KB)
----patterns.gbk.dat(9.19MB)