文件名称:gohll:Go中HLL ++的实现
文件大小:48KB
文件格式:ZIP
更新时间:2024-04-26 12:14:38
Go
GoHLL 适用于地鼠的 这是什么? 您是否曾经有过大量的数据集(或者甚至是永无止境的数据流),并且想知道有多少个独特的商品? 或者,也许您有两组数据,您想知道两组中有多少个唯一项? 也许在两个数据集中都出现了多少项? 好吧, gohll适合您! HLL是一种概率计数算法,可以告诉您已添加多少个唯一项。 此外,您可以在多个HLL对象之间执行联合和相交操作。 这很容易! 让我演示给你看: // First we make an HLL with an error rate of ~0.1% h, _ := NewHLLByError(0.001) // Now it's time to start adding things to it! for i := 0; i < 100000; i += 1 { h.Add(fmt.Sprintf("%d", rand.Uint32(
【文件预览】:
gohll-master
----.travis.yml(146B)
----gob_test.go(2KB)
----tempset.go(756B)
----auxillary.go(3KB)
----sparselist.go(3KB)
----gohll_test.go(5KB)
----hack.go(272B)
----bitoperations_test.go(868B)
----bias.go(74KB)
----mmh3()
--------mmh3.go(3KB)
--------hack.go(767B)
--------mmh3_test.go(384B)
----.gitignore(11B)
----gohll.go(9KB)
----bitoperations.go(1KB)
----README.md(7KB)
----gob.go(1KB)
----auxillary_test.go(2KB)
----LICENSE.txt(1KB)
----sparselist_test.go(1009B)