miniparquet:读取Parquet文件子集的库

时间:2024-04-04 22:34:22
【文件属性】:

文件名称:miniparquet:读取Parquet文件子集的库

文件大小:201KB

文件格式:ZIP

更新时间:2024-04-04 22:34:22

cpp cpp11 parquet parquet-files dependency-free

迷你实木复合地板 miniparquet是Parquet文件常见子集的阅读器。 miniparquet仅支持矩形数据结构(无嵌套表),仅支持Snappy压缩方案。 miniparquet没有(零,无,0),并且非常轻巧。 它可以在几秒钟内编译为1 MB以下的二进制大小。 安装 Miniparquet是C ++库,一个Python包和一个R包。 像这样安装R软件包: devtools::install_github("hannesmuehleisen/miniparquet") 可以通过键入make来构建C ++库。 使用python setup.py install来安装Python软件包。 用法 像这样使用R包: df <- miniparquet::parquet_read("example.parquet") 结构类似的Parquet文件的文件夹(例如,由Spark生成)可


【文件预览】:
miniparquet-master
----.travis.yml(1KB)
----pq2csv.cpp(3KB)
----roundingdiff.py(3KB)
----man()
--------parquet_read.Rd(506B)
----NAMESPACE(106B)
----tests()
--------testthat()
--------data()
--------testthat.R(36B)
----test.sh(277B)
----inst()
--------extdata()
----LICENSE(47B)
----src()
--------rwrapper.cpp(9KB)
--------parquet()
--------Makevars(262B)
--------miniparquet.h(2KB)
--------thrift()
--------miniparquet.cpp(26KB)
--------snappy()
--------pywrapper.cpp(6KB)
----.Rbuildignore(172B)
----dependencies.R(69B)
----setup.py(1KB)
----.gitignore(100B)
----R()
--------miniparquet.R(242B)
----Makefile(976B)
----DESCRIPTION(688B)
----README.md(2KB)
----dump.py(435B)
----bench.cpp(1KB)
----parquet.thrift(30KB)

网友评论