文件名称:hyperloglog:Java中的HyperLogLog(原始和hyperloglog ++)算法实现
文件大小:80KB
文件格式:ZIP
更新时间:2024-05-26 13:13:03
Java
超级日志 HyperLogLog是一种了不起的数据结构,用于估计使用很少内存的大型数据集的基数(具有很高的准确性)。 HyperLogLog的此实现包含Flajolet等人的原始算法 以及hyperloglog ++算法 。 有关博客文章/论文的信息,请参见“参考”部分,以了解超级日志的内部工作原理。 特征 内置支持32位和64位哈希码(分别为Murmur3_32和Murmur3_128) API支持直接指定哈希码(而不是使用内部的哈希码) SPARSE和DENSE编码支持 DENSE寄存器的位打包可实现更好的压缩。 带有位打包的序列化超日志大小,对于数百万个不同的项目,约为10KB,对于数十亿个不同的项目,约为12K。 禁用位打包时,序列化的大小为〜16KB。 SPARSE寄存器的增量编码和varint。 稀疏表示的序列化超日志大小从低至10s字节(布尔列)开始。 使用查找表进
【文件预览】:
hyperloglog-master
----benchmarks()
--------src()
--------pom.xml(6KB)
----src()
--------test()
--------main()
--------java()
----.travis.yml(904B)
----LICENSE(11KB)
----README.md(5KB)
----pom.xml(10KB)
----hll(191B)
----.gitignore(484B)