【文件属性】:
文件名称:spark_codebase:带有基线单元测试的 Spark 核心、流、sql、mllib 示例和应用程序的集合
文件大小:18.36MB
文件格式:ZIP
更新时间:2021-06-06 18:52:05
Scala
Cloudwick Spark 代码库
该存储库是 Spark 生态系统各个组件(包括 Spark-Core、Spark-Streaming、Spark-SQL、Spark-MLLib)的 Spark 示例和用例实现的集合。
这个存储库包含什么?
Spark核心示例
Spark 流示例
Spark 核心用例
Spark 流用例一个简单的火花流用例,用于执行 Apache 日志分析,它可以从 Kafka 和 Kinesis 读取数据,执行一些分析并将结果保存到 cassandra。
测试
Spark 核心、流媒体和 SQL API 的 ScalaTest 规范特征
用于测试的嵌入式和嵌入式服务器实例
如何下载?
最简单的方法是克隆存储库:
git clone https://github.com/cloudwicklabs/spark_codebase.git
如何运行这些?
【文件预览】:
spark_codebase-master
----Vagrantfile(1KB)
----src()
--------test()
--------main()
----build.sbt(4KB)
----SparkTuning.md(0B)
----.gitignore(267B)
----project()
--------plugins.sbt(91B)
--------assembly.sbt(56B)
--------build.properties(20B)
----README.md(2KB)