GraphX 的特点是离线计算、批量处理,基于同步的 BSP 模型(Bulk Synchronous Parallel Computing Model,整体同步并行计算模型),这样的优势在于可以提升数据处理的吞吐量和规模,但是会造成速度上稍逊一筹。目前大规模图处理框架还有基于 MPI模型的异步图计算模型 GraphLab 和同样基于 BSP 模型的 Graph 等。
相关文章
- 基于Spark的图计算框架 GraphX 入门介绍
- 用Apache Spark进行大数据处理之用Spark GraphX图数据分析(6)
- 使用Apache Spark和BigDL来构建深度学习驱动的大数据分析
- 分享一个.NET平台开源免费跨平台的大数据分析框架.NET for Apache Spark
- 用Apache Spark进行大数据处理 - 第六部分: 用Spark GraphX进行图数据分析
- Spark相比Hadoop MapReduce的特点
- 明风:分布式图计算的平台Spark GraphX 在淘宝的实践
- GraphX:基于Spark的弹性分布式图计算系统
- 在Apache Spark中读取漂亮的print json文件
- nginx和apache的特点优点和使用场景