spark-graphx-phoenix:Spark Phoenix与GraphX集成的示例代码

时间:2024-06-14 12:10:34
【文件属性】:

文件名称:spark-graphx-phoenix:Spark Phoenix与GraphX集成的示例代码

文件大小:987KB

文件格式:ZIP

更新时间:2024-06-14 12:10:34

Scala

凤凰城和星火的PageRank 尽管Phoenix内置了许多出色的分析实用程序,但是某些任务(例如图形处理)更适合外部引擎(例如Spark的GraphX)。 本示例从Phoenix加载了Stanford Network Analysis Project [1]的Enron电子邮件测试集,并在其上执行PageRank的GraphX实现以查找有趣的实体。 然后将结果保存回Phoenix。 [1] 先决条件 安装Phoenix 4.4.0+ 设置Spark 1.3.0+(确保phoenix-client JAR在Spark驱动程序类路径中) 加载样本数据 登录到安装了Phoenix的节点: cd /path/to/phoenix/bin ./sqlline.py localhost 进入SQLLine控制台后,我们将创建用于保存输入数据的表以及用于pagerank结果的目标表。


【文件预览】:
spark-graphx-phoenix-master
----.gitignore(193B)
----src()
--------main()
----README.md(2KB)
----enron.csv.gz(1013KB)
----build.sbt(342B)

网友评论