sketchy:Clojure的草图绘制算法(bloom过滤器,min-hash,hyper-loglog,count-min草图)

时间:2024-02-21 04:31:05
【文件属性】:

文件名称:sketchy:Clojure的草图绘制算法(bloom过滤器,min-hash,hyper-loglog,count-min草图)

文件大小:119KB

文件格式:ZIP

更新时间:2024-02-21 04:31:05

hashing clojure bloom-filter minhash sketching

Clojure中的草绘算法 安装 sketchy可从一个Maven构件 。 总览 该库包含各种基于草图/散列的算法,可用于构建大型数据集的紧凑摘要。 所有草图均使用香草Clojure数据结构组成。 这意味着不变性和易于序列化,但性能却很差。 对于需要速度的用户, 是一个不错的选择。 通用工具: 基于草图/哈希的算法: 当我们复习每个部分时,请随时关注REPL。 请注意,对于我们的代码示例, bigml.sketchy.test.demo将“哈姆雷特”和“仲夏夜之梦”加载到内存中。 user> ( ns test ( :use [bigml.sketchy.test.demo]) ( :require ( bigml.sketchy [murmur :as murmur] [bits :as bits] [bloom :as bloom] [min-has


【文件预览】:
sketchy-master
----res()
--------midsummer.txt.gz(36KB)
--------hamlet.txt.gz(65KB)
----project.clj(587B)
----test()
--------bigml()
----LICENSE(551B)
----src()
--------clj()
--------java()
----.gitignore(76B)
----README.md(11KB)

网友评论