如果cuda需要调试需要在配置cmake:
cmake配置
set(CUDA_NVCC_FLAGS -G;-g)
命令行编译配置:
nvcc –g –G MatrixCUDA.cu –o MatrixCUDA
打开 nvidia nsight monitor ->options进行设置
2.尽量把WDDM TDR Delay 调大点
3.将 use this monitor for cuda attach 设置为true
现在就可以开始debug和性能分析了
设置断点后,需要重新生成一下,点击nsight
我们主要使用两个功能: 1 :start cuda debugging(legacy) 2: start performance analyis
1:点击start cuda debugging(legacy)就可以debug了
2.start performance analyis
需要勾选 trace setting cuda 才能分析
点击 application control ->launch 开始运行 可以通过capture control 来控制开始停止
结束直接kill掉