Parquet格式:Apache Parquet

时间:2024-02-24 14:15:29
【文件属性】:

文件名称:Parquet格式:Apache Parquet

文件大小:560KB

文件格式:ZIP

更新时间:2024-02-24 14:15:29

java big-data parquet JavaJava

木地板 Parquet是一种支持嵌套数据的列式存储格式。 实木复合地板元数据使用Apache Thrift进行编码。 Parquet-format项目包含所有Thrift定义,这些定义对于创建Parquet文件的读取器和写入器是必需的。 动机 我们创建Parquet是为了使Hadoop生态系统中的任何项目都可以使用压缩的,高效的列式数据表示形式。 Parquet是从头开始构建的,考虑到了复杂的嵌套数据结构,并使用了Dremel论文中描述的。 我们相信这种方法优于嵌套名称空间的简单扁平化。 Parquet构建为支持非常有效的压缩和编码方案。 多个项目已经证明了对数据应用正确的压缩和编码


【文件预览】:
parquet-format-master
----.gitignore(872B)
----changelog.sh(2KB)
----LogicalTypes.md(29KB)
----Makefile(1KB)
----src()
--------main()
--------test()
----.travis.yml(1KB)
----CONTRIBUTING.md(1KB)
----LICENSE(11KB)
----doc()
--------images()
----.github()
--------PULL_REQUEST_TEMPLATE.md(1KB)
----pom.xml(10KB)
----README.md(13KB)
----PageIndex.md(5KB)
----NOTICE(172B)
----Encodings.md(14KB)
----Encryption.md(27KB)
----CHANGES.md(13KB)
----licenses()
--------LICENSE.slf4j.txt(1KB)
----BloomFilter.md(14KB)
----dev()
--------finalize-release(1KB)
--------prepare-release.sh(1KB)
--------merge_parquet_pr.py(14KB)
--------source-release.sh(2KB)
--------README.md(3KB)
----KEYS(23KB)
----logo()
--------parquet-logos_1.svg(2KB)
--------parquet-logos_3.svg(7KB)
--------parquet-logos.pdf(178KB)
--------parquet-logos_2.svg(7KB)

网友评论