文件名称:PyTables:一个Python包,用于管理大量数据
文件大小:4.54MB
文件格式:ZIP
更新时间:2024-05-23 05:19:49
C
PyTables:Python中的分层数据集 网址: PyTables是一个用于管理分层数据集的软件包,旨在有效地处理大量数据。 它建立在HDF5库和NumPy包的基础上。 它具有面向对象的接口,并结合了代码的性能关键部分(使用Cython生成)的C扩展,使其成为一种快速但极其易于使用的工具,用于交互式保存和检索大量数据。 PyTables的一个重要功能是优化内存和磁盘资源,以使其比其他解决方案(例如关系型或面向对象的数据库)占用更少的空间(介于3到5之间,如果数据是可压缩的,则占用更多空间)。 最先进的压缩 PyTables为提供了开箱即用的支持。 这允许极高的压缩速度,同时保持适当的压缩比。 这样,可以在很大程度上加速I / O,并且最终可能会获得比I / O子系统提供的带宽更高的性能。 有关某些基准,请参阅用户文档的“ 。 不是RDBMS的替代品 PyTables并非旨在作为关