《CUDA C编程权威指南》——1.3　用GPU输出Hello World

时间：2024-05-21 15:18:35

本节书摘来自华章计算机《CUDA C编程权威指南》一书中的第1章，第1.3节，作者 [美] 马克斯·格罗斯曼（Max Grossman），译颜成钢殷建李亮，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3　用GPU输出Hello World

学习一个新编程语言的最好方法就是使用这种新语言来编写程序。在本节，你将开始编写在GPU上运行的第一个内核代码。像其他任何编程语言一样编写GPU上的第一个程序是输出字符串“Hello World”。

如果这是你第一次使用CUDA，在Linux系统中，你可能想使用以下命令来检查CUDA编译器是否正确安装：

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

通常的结果可能是：

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

你还需要检查你的机器上是否安装了GPU加速卡。对此你可以在Linux系统上使用以下命令：

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

通常的结果是：

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

在这个例子中，你安装了两个GPU卡（不同的用户配置可能有所不同，因此显示结果会有所差异）。现在你要准备好写你的第一个CUDA C程序。写一个CUDA C程序，你需要以下几个步骤：

1.用专用扩展名.cu来创建一个源文件。
2.使用CUDA nvcc编译器来编译程序。
3.从命令行运行可执行文件，这个文件有可在GPU上运行的内核代码。

首先，我们编写一个C语言程序来输出“Hello World”，如下所示：

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

把代码保存到hello.cu中，然后使用nvcc编译器来编译。CUDA nvcc编译器和gcc编译器及其他编译器有相似的语义。

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

如果你运行可执行文件hello，将会输出：

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

接下来，编写一个内核函数，命名为helloFromGPU，用它来输出字符串“Hello World from GPU!”。

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

修饰符__global__告诉编译器这个函数将会从CPU中调用，然后在GPU上执行。用下面的代码启动内核函数。

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

三重尖括号意味着从主线程到设备端代码的调用。一个内核函数通过一组线程来执行，所有线程执行相同的代码。三重尖括号里面的参数是执行配置，用来说明使用多少线程来执行内核函数。在这个例子中，有10个GPU线程被调用。综上所述，得到代码清单1-1所示的程序。

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

函数cudaDeviceRest()用来显式地释放和清空当前进程中与当前设备有关的所有资源。如下所示，在nvcc命令行中使用-arch sm_20进行编译：

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

开关语句-arch sm_20使编译器为Fermi架构生成设备代码。运行这个可执行文件，它将输出10条字符串“Hello World from GPU”，每个线程输出1条。

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

相关文章

《CUDA C编程权威指南》——1.3　用GPU输出Hello World

