文件名称:CUDA-Fortran:该存储库旨在提供Fortran 90中的一些基本CUDA编程实践。
文件大小:121KB
文件格式:ZIP
更新时间:2024-06-07 13:16:18
Fortran
CUDA Fortran 90功能测试 目的 该存储库的目的是试验Fortran 90中CUDA编程的基础知识。该存储库由几个小项目组成,用于测试加速,内存分配,流式传输等。它可用作在CUDA中使用CUDA编程的基本参考。现代Fortran。 值得一提的是,其中一些示例直接取自[PGI CUDA Fortran编程指南] [ ]; 这些文件夹在其目录名称中带有example 。 内容 01-get-threadid example-5.1 :使用CPU(双循环或OpenBLAS)和GPU(cuBLAS和切片)进行矩阵乘法的大型矩阵的广泛示例。 example-5.2 :映射内存分配的副本 memory-bandwidth :测量固定和可分页内存的有效Host2Device和Device2Host传输。 async-data-transfer :测量四种不同数据传输策略的延迟 要求
【文件预览】:
CUDA-Fortran-master
----.gitignore(33B)
----data-movement()
--------exper_1.cuf~(8KB)
--------Makefile(314B)
--------Readme.md(306B)
--------exper_1.cuf(8KB)
--------data_move.cuf(8KB)
----memory-bandwidth()
----memory-texture()
--------tex_vs_intent.f90(1KB)
--------.gitignore(23B)
--------compile.sh(395B)
--------kernels.cuf(1KB)
--------Readme.md(1KB)
--------main.f90(1KB)
----async-data-transfer()
----copy_ILP()
--------compile.sh(272B)
--------kerns.cuf(1KB)
--------Readme.md(2KB)
--------main.f90(4KB)
----Readme.md(1KB)
----example-5.1()
--------Makefile(507B)
--------host_lib.cuf(4KB)
--------Readme.md(3KB)
--------dev_lib.cuf(1KB)
--------modules(95B)
--------compute.cuf(1KB)
----example-5.2()
--------Makefile(400B)
--------prog.cuf~(2KB)
--------page77.cuf(817B)
--------dev.cuf(405B)
--------Readme.md(2KB)
--------dev_lib.cuf(479B)
--------prog.cuf(2KB)
--------modules(95B)
----memory-access()
--------Tesla_K40c.png(28KB)
--------plot_access.py(1KB)
--------access.f90(4KB)
--------Makefile(687B)
--------Tesla K40c.txt(2KB)
--------kern_misaligned.cuf(397B)
--------Readme.md(2KB)
--------Tesla_K20Xm.png(28KB)
--------average.f90(5KB)
--------kern_strided.cuf(884B)
--------Tesla K20Xm.txt(2KB)
--------Tesla K40c.png(24KB)
--------kern_averages.cuf(2KB)
--------kern_texture.cuf(440B)
----accelerated-stellar-pulsation-code()
----01-get_threadid()
--------exe(26KB)
--------Makefile(411B)
--------run.cuf(420B)
--------Readme.md(145B)
--------dev_lib.cuf(258B)