intake-parquet:入口木地板插件

时间:2024-06-16 16:02:01
【文件属性】:

文件名称:intake-parquet:入口木地板插件

文件大小:155KB

文件格式:ZIP

更新时间:2024-06-16 16:02:01

Python

实木复合地板 接口为镶木地板二进制表格数据格式。 Parquet在大数据生态系统中非常流行,因为它提供了对列数据的逐条和逐块访问,并具有有效的编码和压缩功能。 这使得该格式对于通过更大的子集甚至更大的数据集进行流式传输特别有效,因此在Hadoop和Spark中很常见。 Parquet数据可以是单个文件,文件目录或嵌套目录,其中目录名称在数据分区中有意义。 特征 拼花地板插件可用于: 高效的元数据解析,因此您无需加载任何数据即可了解数据类型和记录数 分区的随机访问 列和索引选择,仅加载您需要的数据 通过基于值的筛选器,您仅加载包含一些有效数据的那些分区(注意:不筛选分区中的值) 安装 conda安装说明如下: conda install -c conda-forge intake-parquet 例子 请参阅examples /目录中的笔记本。


【文件预览】:
intake-parquet-master
----MANIFEST.in(282B)
----.travis.yml(2KB)
----docs()
--------environment.yml(166B)
--------make.bat(783B)
--------requirements.txt(34B)
--------Makefile(613B)
--------README.md(262B)
--------source()
----intake_parquet()
--------source.py(4KB)
--------__init__.py(156B)
--------_version.py(18KB)
----tests()
--------utils.py(225B)
--------test2.parq(81KB)
--------test.parq()
--------test_source.py(4KB)
--------__init__.py(0B)
--------cache_cat.yaml(200B)
--------split()
--------test_discovery.py(404B)
----LICENSE(1KB)
----setup.cfg(145B)
----conda()
--------meta.yaml(676B)
----requirements.txt(39B)
----examples()
--------test.parq(19B)
--------example.ipynb(14KB)
--------sample.yml(184B)
----setup.py(775B)
----.gitignore(1KB)
----readthedocs.yml(38B)
----README.md(1KB)
----versioneer.py(67KB)
----.gitattributes(40B)

网友评论