HyperMinHash-java:日志日志空间中的并集,交集和设置基数

时间:2024-06-14 17:28:27
【文件属性】:

文件名称:HyperMinHash-java:日志日志空间中的并集,交集和设置基数

文件大小:74KB

文件格式:ZIP

更新时间:2024-06-14 17:28:27

java minhash hyperloglog cardinality-estimation cardinality

HyperMinHash-java 提出的HyperMinHash算法的Java实现。 HyperMinHash仅使用对数记录空间即可高精度地近似非常大的集合的集合并集,交集,Jaccard索引和基数。 它还支持流更新和合并草图,与HyperLogLog相同。 此存储库实现了HyperMinHash的两种形式: HyperMinHash :基于HyperLogLog的实现,并添加了HyperLogLog ++中所见的偏差校正。 BetaMinHash :一种使用进行底层LogLog实现的实现。 Loglog-beta的准确性几乎与HyperLogLog ++相同,不同之处在于,它在固定内存的情况下,对小型数据集(n <= 80k)的基数估计具有更好的性能。 由于我们使用Loglog-Beta,因此我们将实现称为BetaMinHash。 但是,我们的实现目前仅支持固定精度p=14 。


【文件预览】:
HyperMinHash-java-master
----.gitignore(22B)
----README.md(4KB)
----pom.xml(7KB)
----.github()
--------CODEOWNERS(45B)
--------settings.yml(306B)
----cd()
--------mvnsettings.xml(1KB)
--------deploy.sh(1KB)
----src()
--------test()
--------main()
----LICENSE.txt(549B)
----.travis.yml(385B)
----NOTICE(101B)

网友评论