文件名称:PyProf:适用于PyTorch模型的GPU性能分析工具
文件大小:126KB
文件格式:ZIP
更新时间:2024-06-02 00:44:06
Python
PyProf-PyTorch分析工具 公告:PyProf的默认分支已更改为“ main”。 请相应地更新所有拉取和PR。 最新发布:您当前正在开发主分支,该分支跟踪开发进度到下一个发行版。 PyProf的最新版本是3.10.0,可在分支上。 PyProf是用于分析和分析PyTorch模型的GPU性能的工具。 PyProf汇总了或内核性能,并提供以下附加功能: 标识启动内核的层:例如,ComputeOffsetsKernel与具体的PyTorch层或API的关联不明显。 确定张量尺寸和精度:在不知道张量尺寸和精度的情况下,不可能推断出实际(硅)内核时间是否接近GPU上此类内核的最大性能。 了解了张量尺寸和精度后,我们可以找出层所需的FLOP和带宽,然后确定内核对该操作的最大性能有多接近。 前向-后向相关性:PyProf确定导致特定权重和数据梯度(wgrad,dgrad)的正向传递步
【文件预览】:
PyProf-main
----MANIFEST.in(40B)
----README.rst(6KB)
----docs()
--------advanced.rst(4KB)
--------quickstart.rst(3KB)
--------conf.py(8KB)
--------_templates()
--------install.rst(2KB)
--------examples.rst(1KB)
--------Makefile(1KB)
--------profile.rst(11KB)
--------index.rst(1002B)
--------faqs.rst(1KB)
----pyprof()
--------nvtx()
--------prof()
--------__init__.py(754B)
--------examples()
--------parse()
----Dockerfile(1KB)
----LICENSE(11KB)
----CONTRIBUTING.md(5KB)
----setup.cfg(3KB)
----VERSION(10B)
----requirements()
--------requirements_nsys.txt(30B)
--------requirements.txt(55B)
----setup.py(3KB)
----.gitignore(98B)
----.dockerignore(5B)
----qa()
--------L0_pyprof_data()
--------L0_nvtx()
--------common()
--------L0_lenet()
--------L0_docs()