sketches:HyperLogLog 和其他用于数据流挖掘的概率数据结构

时间:2024-07-29 07:59:38
【文件属性】:

文件名称:sketches:HyperLogLog 和其他用于数据流挖掘的概率数据结构

文件大小:4KB

文件格式:ZIP

更新时间:2024-07-29 07:59:38

data-stream sketches hyperloglog Python

草图 又名概率数据结构,用于在纯 Python 中挖掘数据流。 安装 python setup.py install 超级日志日志 原论文: : 更多信息: : 用法: from sketches import HyperLogLog h = HyperLogLog(10) for i in range(100000): h.add(i) print(h.estimate()) > 99860.5333365 计数分钟 原论文: 更多信息: : 用法: from sketches import CountMin s = CountMin(10, 10) data = np.random.zipf(2, 10000) for v in data: s.add(v) print(s.estimate(1)) > 6130.0 print(len([x


【文件预览】:
sketches-master
----setup.py(361B)
----README.md(1KB)
----sketches()
--------hashing.py(108B)
--------__init__.py(169B)
--------heavyhitters.py(630B)
--------hyperloglog.py(3KB)
--------countmin.py(1002B)

网友评论