该问题的关键在于理解CUDA项目中C\C++文件需要由c++编译器进行编译,而CUDA C的源文件需要由CUDA的编译器nvcc.exe进行编译。
发生该语法错误的原因是cu文件被C++编译器所编译,C++编译器无法识别 “<<<”,导致报错。
为什么cu文件会被C++编译器所编译呢?原因在于我们使用#include将cu文件包含到了C++文件中。对于#include的用途,更简单的理解就是把几个文件合并成一个文件,所以,当编译C++文件中,包含其中的cu文件也会被编译,从而导致 “<<<”运算符被C++编译器编译,导致语法错误。
问题原因:不能直接把cuda程序放入cpp中去调用,即核函数的调用语句add<<<2, 128>>>(dev_a, dev_b, dev_c,size); 不能出现在 .cpp 文件中。
解决办法:可以在 .cu 文件中封装一层,就是在 .cu 文件中写一个传同样参数的核函数调用函数addKernel(int *a, int *b, int *c, int size),即在addKernel(int *a, int *b, int *c, int size)函数中调用核函数add<<<2, 128>>>(dev_a, dev_b, dev_c,size),然后在外边main.cpp文件中用调用普通函数的方法调用addKernel(int *a, int *b, int *c, int size)函数,此外需要在addKernel(int *a, int *b, int *c, int size)函数的定义之处和main.cpp文件头部将addKernel(int *a, int *b, int *c, int size)声明为外部函数,即需要用extern "C" 声明。这也是为什么在调用cu文件中核函数的间接调用函数addKernel(int *a, int *b, int *c, int size)时我们需要使用 extern “C”。
示例如下:
(1)创建一个CUDA 6.5 的项目,新建一个main.cpp文件,添加代码如下:
#include <stdio.h>
#include <stdlib.h>
//#include "kernel.cu" #define N 256
extern "C" void addKernel(int *a, int *b, int *c, int size); int main(int argc, char **argv)
{
int a[N];
int b[N];
int c[N]; for (int i=; i<N; i++)
{
a[i]=i;
b[i]=*i;
c[i]=;
}
addKernel(a, b, c, N);
for(int i=; i<N; i++)
{
printf("%d is %d.\n", i, c[i]);
}
return ;
}
(2)将kernel.cu文件清空后写入下述代码:
#include "cuda_runtime.h"
#include "device_launch_parameters.h" __global__ void add(const int *a, const int *b, int *c, int size)
{
int tid = threadIdx.x + blockIdx.x * blockDim.x;
c[tid] = b[tid] + a[tid];
} extern "C" void addKernel(const int *a, const int *b, int *c, int size)
{
int *dev_a=;
int *dev_b=;
int *dev_c=; cudaSetDevice();
cudaMalloc((void**)&dev_a, sizeof(int)*size);
cudaMalloc((void**)&dev_b, sizeof(int)*size);
cudaMalloc((void**)&dev_c, sizeof(int)*size);
cudaMemcpy(dev_a, a, sizeof(int)*size, cudaMemcpyHostToDevice);
cudaMemcpy(dev_b, b, sizeof(int)*size, cudaMemcpyHostToDevice);
cudaMemcpy(dev_c, c, sizeof(int)*size, cudaMemcpyHostToDevice); add<<<, >>>(dev_a, dev_b, dev_c,size); cudaMemcpy(c, dev_c, size * sizeof(int), cudaMemcpyDeviceToHost); cudaFree(dev_a);
cudaFree(dev_b);
cudaFree(dev_c);
}
(3)编译执行。结果如下所示
这时显示是成功的。
(4)把main.cpp中的注释行取消注释,重新编译执行。结果如下所示:
出现文中所述问题。
参考链接:
1、关于CUDA C 项目中“ error C2059: 语法错误:“<” ”问题的解决方法