文件名称:apache spark data pipeline osDQ:osDQ致力于使用JSON创建基于Apache Spark的数据管道-开源
文件大小:135.14MB
文件格式:ZIP
更新时间:2024-06-01 11:05:06
开源软件
这是开源数据质量(osDQ)项目的分支项目https://sourceforge.net/projects/dataquality/此子项目将创建基于apache spark的数据管道,其中将使用基于JSON的元数据(文件)来运行数据处理,大数据的数据管道,数据质量以及数据准备和数据建模功能。 这使用Apache Spark的Java API。 它也可以在本地模式下运行。 在https://github.com/arrahtech/osdq-spark获取json示例如何运行解压缩zip文件Windows:java -cp。\ lib \ *; osdq-spark-0.0.1.jar org.arrah.framework。 spark.run.TransformRunner -c。\ example \ samplerun.json Mac UNIX java -cp ./lib/*:./osdq-spark-0.0.1.jar org.arrah.framework.spark.run.TransformRunner -c。 /example/samplerun.json对于Wi