sequencefiles:支持关于从序列文件加载数据的博客文章的代码

时间:2024-07-14 21:25:26
【文件属性】:

文件名称:sequencefiles:支持关于从序列文件加载数据的博客文章的代码

文件大小:7KB

文件格式:ZIP

更新时间:2024-07-14 21:25:26

Java

关于 该存储库包含一个简单的项目,用于演示将 SequenceFile 数据加载到 Kite 数据集。 该示例使用来自的。 创建示例序列文件 首先,通过运行从 JSON 数据文件zips.json创建一个序列文件: mvn package exec:java 您可以编辑 POM 文件以更改zips.json的预期位置。 该命令将创建zips.sequence 。 使用 Kite 加载 SequenceFile 您可以使用 inputformat-import 命令将示例 SequenceFile 加载到 Kite 数据集中。 首先,将序列文件加载到 HDFS: hadoop fs -copyFromLocal zips.sequence 接下来,从zips-1.jar的 ZipCode 类构建一个架构: kite-dataset obj-schema org.kitesd


【文件预览】:
sequencefiles-master
----pom.xml(2KB)
----src()
--------main()
----.gitignore(23B)
----README.md(2KB)

网友评论