本篇是GPGPU 架构汇总的总章,参考的是AMD公布OpenCL 手册,该手册总结了AMD. Nvdia 早年的GPGPU体系架构,以及Opencl 各个API 与硬件结构的映射关系。本篇除了整理这两家的GPU 架构,也会增加Intel dGPU的架构(牙膏厂终于回过神了。。。。)
对于现代的 GPU,通常的它的控制逻辑单元比较简单(和 cpu 相比), cache 也比较小 。
线程切换开销比较小,都是轻量级的线程
GPU 的每个“核”有大量的 ALU 以及很小的用户可管理的 cache。
内存总线都是基于带宽优化的。 150GB/s 的带宽可以使得大量 ALU 同时进行内存操作 。
* AMD GPU 硬件架构
* Nvdia GPU Femi 架构
* Intel GPU Gen11 架构