理解CUDA中的cudaMalloc的参数

时间:2025-04-01 09:42:41

函数的原型:

cudaError_t cudaMalloc (void **devPtr, size_t  size ); 

返回值是CUDA中定义的一个错误代码。

Host端创建一个指针变量,将这个指针变量传入到cudaMalloc()函数。Device端根据设置创建内存后,会将内存首地址赋值给Host端的指针变量,故参数设置需要**(指针变量地址)。

例子:

float *Device_Matrix = NULL;
size_t size = 1024 * sizeof(float);
cudaMalloc((void**)&Device_Matrix , size);