文件名称:KMV的MATLAB的代码-cardest:Haskell基数估计
文件大小:5KB
文件格式:ZIP
更新时间:2024-06-15 06:50:55
系统开源
KMV的MATLAB的代码Haskell中的基数估计算法 今年早些时候,我观看了Avi Bryant的演讲,该演讲特别向我介绍了HyperLogLog算法和总体基数估计。 它给我留下了深刻的印象,还有Neustar(以前称为Aggregate Knowledge)的许多人对我的印象非常深刻,并激发了我在Haskell中实施几个基数算法作为的一个项目。 Neustar的帖子在讨论HLL时曾多次提及(k个最小值),并提到这是一种更简单的算法,因此我决定首先从实现它开始。 这两点代表了基数估计历史上作为研究领域的要点,并且在方法方面形成了有趣的对比(可观察到的顺序统计量-KMV-与可观察到的位模式-HLL)。 尽管存在许多HLL的实现(包括in),但是我想实现自己的实现以更深入地了解这些算法的工作原理。 在这两种情况下,它都使抽象理解和具体获取有所不同,我向所有想了解更多信息的人推荐它。
【文件预览】:
cardest-master
----HLL.hs(4KB)
----KMV.hs(3KB)
----README.md(1KB)
----.gitignore(30B)