文件名称:accelerator_interoperability:加速器互操作性的几个示例
文件大小:7KB
文件格式:ZIP
更新时间:2024-06-10 11:27:17
Fortran
加速器互操作性 FFT:FFT C和Fortran样本展示了如何将OpenACC数据区域与GPU库(如CUFFT)组合在一起。 由于必须使用nvcc编译器来编译包含CUFFT函数调用的文件,而必须使用cc / CC / ftn来编译包含CUFFT函数的文件,因此有必要创建包装器函数,如下所示。 将使用acc host_data use_device指令,这将导致在指令范围内的主机代码中使用指定变量的设备分配的内存地址。 哈希:哈希C和Fortran示例展示了如何在单个应用程序中利用OpenACC,cuRand和Thrust。 此示例将使用cuRand生成随机数据,使用OpenACC对该数据进行哈希处理,最后使用Thrust将数据按规范顺序进行排序。 尽管提供此示例只是为了说明OpenACC的互操作性,但考虑到交错的3D位置(x1,y1,z1,x2,y2,z2 ...),仅使用一个简单的最