spark_codebase:带有基线单元测试的 Spark 核心、流、sql、mllib 示例和应用程序的集合

时间:2024-06-26 12:38:45
【文件属性】:

文件名称:spark_codebase:带有基线单元测试的 Spark 核心、流、sql、mllib 示例和应用程序的集合

文件大小:18.36MB

文件格式:ZIP

更新时间:2024-06-26 12:38:45

Scala

Cloudwick Spark 代码库 该存储库是 Spark 生态系统各个组件(包括 Spark-Core、Spark-Streaming、Spark-SQL、Spark-MLLib)的 Spark 示例和用例实现的集合。 这个存储库包含什么? Spark核心示例 Spark 流示例 Spark 核心用例 Spark 流用例一个简单的火花流用例,用于执行 Apache 日志分析,它可以从 Kafka 和 Kinesis 读取数据,执行一些分析并将结果保存到 cassandra。 测试 Spark 核心、流媒体和 SQL API 的 ScalaTest 规范特征 用于测试的嵌入式和嵌入式服务器实例 如何下载? 最简单的方法是克隆存储库: git clone https://github.com/cloudwicklabs/spark_codebase.git 如何运行这些?


【文件预览】:
spark_codebase-master
----Vagrantfile(1KB)
----src()
--------test()
--------main()
----build.sbt(4KB)
----SparkTuning.md(0B)
----.gitignore(267B)
----project()
--------plugins.sbt(91B)
--------assembly.sbt(56B)
--------build.properties(20B)
----README.md(2KB)

网友评论