cuda nsight 调试和性能分析

时间:2024-03-31 10:43:04

如果cuda需要调试需要在配置cmake:

cmake配置

set(CUDA_NVCC_FLAGS -G;-g)

命令行编译配置:

nvcc –g –G MatrixCUDA.cu –o MatrixCUDA

打开 nvidia nsight monitor ->options进行设置

cuda nsight 调试和性能分析

2.尽量把WDDM TDR Delay 调大点

cuda nsight 调试和性能分析

3.将 use this monitor for cuda attach 设置为true

cuda nsight 调试和性能分析

现在就可以开始debug和性能分析了

设置断点后,需要重新生成一下,点击nsight

 

cuda nsight 调试和性能分析

我们主要使用两个功能: 1 :start cuda debugging(legacy) 2: start performance analyis

cuda nsight 调试和性能分析

1:点击start cuda debugging(legacy)就可以debug了

2.start performance analyis

需要勾选 trace setting cuda 才能分析

点击 application control ->launch 开始运行 可以通过capture control 来控制开始停止

结束直接kill掉

cuda nsight 调试和性能分析