面向MapReduce计算的大规模集群通信优化

时间:2024-05-20 07:35:40
【文件属性】:

文件名称:面向MapReduce计算的大规模集群通信优化

文件大小:1.3MB

文件格式:PDF

更新时间:2024-05-20 07:35:40

数据通信优化 MapReduce 软件定义网络

为了优化大规模集群运行MapReduce作业时的通信效率和减少shuffle数据传输量,首先采用存储局部性换取通信局部性的策略建立一个分布式协同数据映射模型;其次通过随机抽样和机器学习方法来提取作业数据的局部性特征,实现map计算数据的有效部署;最后,利用软件定义网络的全局灵活控制能力,优选通信链路好的节点并将计算任务映射到该类节点中。实验表明对于中间数据混洗密集类作业有较好的优化效果,通信延迟降低了4.3%~5.8%。该方案能减少shuffle流量和数据迁移延迟,并且适合各种调度策略和网络拓扑结构。


网友评论