文件名称:论文研究-基于GPU的并行优化技术.pdf
文件大小:515KB
文件格式:PDF
更新时间:2022-08-11 13:22:24
图形处理器,并行优化,累加和,统一计算设备架构
针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法在GPU上的执行效率,优化后累加和算法的运算速度相比标准并行算法提高了约34倍,相比CPU串行实现提高了约70倍。