文件名称:tdigest:在线积累基于等级的统计信息,例如分位数和修整后的均值
文件大小:212KB
文件格式:ZIP
更新时间:2024-06-08 08:09:58
Haskell
最简单的 一种新的数据结构,用于精确在线累积基于等级的统计信息,例如分位数和修整后的均值。 参见原始论文:Ted Dunning和Otmar Ertl撰写的 概要 λ * Data. TDigest > median (tdigest [ 1 .. 1000 ] :: TDigest 3 ) Just 499.0090729817737 基准测试 使用50M指数分布的数字: 平均: 16s ; 不正确的中值近似值,主要是为了测量prng速度 使用vector-algorithms排序: 33s ; 使用1000MB的内存 激发t-消化(使用一些par ): 53s 缓冲t-消化: 68s 连续t消化: 65s 直方图示例 tdigest-simple -m tdigest -d standard -s 100000 -c 10 -o output.svg -i 34 cp out
【文件预览】:
tdigest-master
----.ghci(17B)
----experiment()
--------Ref.hs(6KB)
--------TreeRef.hs(9KB)
----tdigest()
--------tdigest.cabal(3KB)
--------src()
--------bench.log.txt(8KB)
--------example.svg(183KB)
--------run-bench.sh(487B)
--------LICENSE(1KB)
--------README.md(1KB)
--------example.png(36KB)
--------tests()
--------CHANGELOG.md(362B)
----.github()
--------workflows()
----cabal.haskell-ci(51B)
----CONTRIBUTING.md(1KB)
----README.md(17B)
----cabal.project(572B)
----tdigest-Chart()
--------example1.svg(216KB)
--------src()
--------example2.png(40KB)
--------example()
--------LICENSE(1KB)
--------README.md(1KB)
--------example2.svg(252KB)
--------tdigest-Chart.cabal(2KB)
--------example1.png(40KB)
--------CHANGELOG.md(99B)
----.stylish-haskell.yaml(397B)
----tdigest-bench()
--------src()
--------LICENSE(1KB)
--------tdigest-bench.cabal(1KB)
----.gitignore(144B)