函数的原型:
cudaError_t cudaMalloc (void **devPtr, size_t size );
返回值是CUDA中定义的一个错误代码。
Host端创建一个指针变量,将这个指针变量传入到cudaMalloc()函数。Device端根据设置创建内存后,会将内存首地址赋值给Host端的指针变量,故参数设置需要**(指针变量地址)。
例子:
float *Device_Matrix = NULL;
size_t size = 1024 * sizeof(float);
cudaMalloc((void**)&Device_Matrix , size);