文件名称:面向CPU-GPU异构并行系统的编程模型与编译优化关键技术研究
文件大小:2.3MB
文件格式:PDF
更新时间:2016-06-28 08:16:57
异构系统 GPU通用计算 博士论文
随着超大规模集成电路技术的不断进步,单芯片上集成了越来越多的晶体管, 目前已达到10亿的量级。然而,受到CMOS工艺特征尺寸的限制,芯片的主频 在达到4GHz之后继续提升的空间有限,多核并行逐渐成为提升处理器计算性能, 同时也是充分利用丰富的片上资源的主要技术途径。4-8核的通用CPU目前已 成为市场主流,而一些专用的处理器如流处理器则包含数十到数百个处理核心。 本文选取目前非常流行也极具发展潜力的一种商用流处理器体系结构——GPU (Graphics Processing Unit)展开相关的研究。 GPU最初仅用于加速图形计算,因此其结构较通用CPU相对简单,不包含 诸如分支预测、乱序执行等耗费芯片资源的复杂逻辑功能,而将晶体管资源更有 效地用于增加并行执行的计算核心,以提升计算性能。GPU的峰值计算性能也因 此远高于同时期的通用CPU。随着GPU指令级功能的逐步完善以及其编程界面 的不断改进,GPU被越来越多地应用到非图形领域的计算,出现了一个全新的 研究领域——GPGPU(General Purpose Computation on GPUs)。利用CPU和GPU 构建异构并行系统,以CPU提供通用的基础计算环境,GPU作为加速阵列提供 强大的峰值计算能力,已成为高性能计算领域一个非常重要的发展趋势。目前, GPU已在高性能计算、桌面计算甚至嵌入式计算等多个领域得到了非常广泛的应 用,因此有关CPU-GPU异构系统以及GPU本身的一系列研究课题也得到广泛关 注,诸如编程模型、编译优化、可靠性优化以及低功耗优化等等。本课题从编程 和编译的角度展开,首先研究了CPU-GPU异构并行系统的编程模型,然后针对 GPU的存储访问展开了深入的分析和优化研究,最后给出了所研究模型的编译实 现和优化。