clj-btable:稀疏,标记为2D数字数据集的二进制序列化格式

时间:2024-05-26 04:25:21
【文件属性】:

文件名称:clj-btable:稀疏,标记为2D数字数据集的二进制序列化格式

文件大小:44KB

文件格式:ZIP

更新时间:2024-05-26 04:25:21

Clojure

表格 一种快速,紧凑的二进制序列化格式,用于稀疏,标记为2D的数字数据集(“二进制表”)。 动机 在使用BTables之前,我们将大型的稀疏2D数据集存储在密集的CSV中,这在空间和性能上都是非常低效的。 尽管我们发现对于我们的用例而言过于复杂,但我们对其进行了研究,并且早期研究并未在性能或空间上取得令人瞩目的收益。 因此,BTables被设计为一种简单,快速且紧凑的格式,可以表示稀疏的数字数据集。 BTable基本上是磁盘上稀疏矩阵的二进制表示形式,其格式是受(CRS)格式启发的,它仅通过存储非零单元格的索引/值来节省空间。 它以严格面向行的格式进行设计,以实现高效的迭代,而不是用于矩阵计算或线性代数的库。 请注意,BTable并不是对所有存储为CSV的数据集的直接替代:效率的提高与数据集的稀疏度成正比。 对于完全非零的病理数据集,占用的空间可能比CSV大得多! 例子 ( requi


【文件预览】:
clj-btable-master
----.gitignore(145B)
----src()
--------java()
--------clj()
----doc()
--------clj-btable.core.html(3KB)
--------js()
--------css()
--------index.html(1KB)
----README.md(2KB)
----test()
--------clj_btable()
----project.clj(485B)

网友评论