【文件属性】:
文件名称:本文组织结构-onfi接口规范
文件大小:3.89MB
文件格式:PDF
更新时间:2021-06-15 11:06:57
CUDA
1.4本文组织结构
本文共由六章组成,各章节主要内容如下:
第1章:首先阐述FIR滤波背景及意义,介绍国内外关于FIR滤波的一些主要算法。
引出基于CUDA平台实现频域FIR滤波并行算法的可行性与意义。最后两节是本论文
的基本内容介绍与论文的组织结构。
第2章:首先介绍了并行计算的基本概念与用户对高并行性无限最求的原因。接着
详细介绍了GPU的特点与发展历史,以及用作通用计算平台的优势。最后描述CUDA
架构的软硬件体系、编程模式。
第3章:介绍FIR滤波器的基本概念与特点,给出设计FIR滤波器过程中使用的加
窗函数法。
第4章:首先给出频域设计FIR滤波的并行算法,在GPU平台上使用CUDA C完
成算法的实现。找出CUDA并行算法执行中影响性能的瓶颈,进行优化。为进行算法
性能的对比,还在多核CPU上实现了频域FIR滤波并行算法。本章的最后是对CUDA
实现频域FIR滤波的正确性验证。
第5章:对基于CUDA的频域FIR滤波并行算法性能进行分析。使用GTX465设
备实现,测试出算法的加速比、浮点运算能力等。分析I/O带宽以及block与流多处理
器对算法执行速度的影响。
第6章:总结本文所做工作,展望未来研究发展方向。
.4.
万方数据