btable-py:BTable 序列化格式的 Python 接口

时间:2024-06-25 06:54:55
【文件属性】:

文件名称:btable-py:BTable 序列化格式的 Python 接口

文件大小:328KB

文件格式:ZIP

更新时间:2024-06-25 06:54:55

Python

btable-py Python 接口,为大型、稀疏、标记的二维数字数据集(“二进制表”)提供快速、紧凑的二进制序列化。 BTable 基本上是磁盘上稀疏矩阵的二进制表示,其格式受(CRS) 格式的启发,通过仅存储非零单元格的索引/值来节省空间。 它以严格面向行的格式设计以实现高效迭代,而不是用于矩阵计算或线性代数的库。 请注意,BTables并不是所有存储为 CSV 的数据集的替代品:效率的提高与数据集的稀疏性成正比。 对于病理完全非零数据集,占用的空间可能比 CSV 大得多! 例子 import btable # Writing a table labels = [ "login" , "view_item" , "purchase" ] rows = [[ 5.0 , 3.0 , 1.0 ], [ 2.0 , 0.0 , 0.0 ], [ 0.0 , 0.0 , 0.0 ]]


【文件预览】:
btable-py-master
----.gitignore(51B)
----README.md(1KB)
----tests()
--------test_btable.py(731B)
----btable()
--------__init__.py(3KB)
--------data()
----requirements.txt(12B)
----setup.py(452B)

网友评论