【文件属性】:
文件名称:GPU架构-onfi接口规范
文件大小:3.89MB
文件格式:PDF
更新时间:2021-06-15 11:07:01
CUDA
2.5 GPU架构
2.5.1 GPU硬件架构
本节主要讨论GPU硬件架构,选取新一代的Fermi“费米”架构加以说明。Fermi
架构的GPU打破很多芯片设计记录,不仅图形渲染性能得到保持,还引进了更快的
Context上下文交换技术,可以像CPU一样,利用Context上下文交换机制完成多任务
的切换。采用并行内核执行机制,增强了block中thread的组织灵活度。使得基于Fermi
架构的GPU计算性能比上一代GPU高出十倍。下面介绍Fermi架构几方面改进【261:
(1)Concurrent Kernel Execution(并发执行内核)
新一代的Fermi架构GPU支持内核函数的并发执行,GPU可同时运行同一程序中
多个内核函数。kernel并发机制可使GPU尽量满负荷工作。为了充分利用GPU计算资
源,Fermi架构允许同一CUDA上下文内核函数都运行在同一个GPU上。而不同应用
.16.
万方数据