scala-bigcollections:长索引的Scala的位和双打大集合

时间:2024-05-28 15:36:44
【文件属性】:

文件名称:scala-bigcollections:长索引的Scala的位和双打大集合

文件大小:18KB

文件格式:ZIP

更新时间:2024-05-28 15:36:44

Scala

描述 Scala BigCollections提供按Long值索引的集合,这意味着它们不限于标准集合之类的20亿个元素。 动机 Scala BigCollections的目标是提供一些简单的集合,这些集合可以容纳实际上可以容纳在内存中的尽可能多的元素。 现代服务器拥有数百GB的可用内存,通过在单个节点上执行所有计算,可以使某些应用程序在操作上保持简单。 最初设想的BigCollections用例是一种用于人类基因组上表观遗传标记的分析软件。 由于参考基因组是30亿个碱基对,因此Int.MaxValue的位图或整数数组将不起作用。 Bed和BigBed之类的格式是此类信息的标准传输方式,但是它们似乎并不能直接转换为内存中的表示形式,该表示形式简单易行,并且可以对大量样本进行大规模计算。 未来的工作 希望看一下H2O使用的压缩技术。 改进的测试套件-我的笔记本电脑不需要执行所有可能的测试所需的


【文件预览】:
scala-bigcollections-master
----.gitignore(110B)
----project()
--------build.properties(18B)
----src()
--------main()
--------test()
----LICENSE(11KB)
----README.md(2KB)
----NOTICE(106B)
----build.sbt(155B)

网友评论