文件名称:inplace:C2RR2C 就地转置的 CUDA 和 OpenMP 实现
文件大小:52KB
文件格式:ZIP
更新时间:2024-07-15 13:30:08
Cuda
到位
C2R 和 R2C 就地转置算法的 CUDA 和 OpenMP 实现。 这些算法在我们的有所描述。
我们已经包含了一个针对非常高、瘦矩阵的专门化,它为结构数组和数组结构之间的就地转换提供了良好的性能。
代码包括 OpenMP 和 CUDA 实现。 OpenMP 实现在
【文件预览】:
inplace-master
----.gitignore(200B)
----inplace()
--------rotate.h(338B)
--------enact.cu(7KB)
--------rotate.cu(7KB)
--------save_array.cu(533B)
--------transpose.h(500B)
--------memory_ops.h(593B)
--------equations.h(4KB)
--------openmp.cpp(4KB)
--------index.h(2KB)
--------SConscript(478B)
--------permute.h(360B)
--------memory_shuffle.cu(1KB)
--------array.h(7KB)
--------smem.h(219B)
--------util()
--------gcd.cpp(601B)
--------register_ops.h(2KB)
--------introspect.cu(874B)
--------save_array.h(120B)
--------reduced_math.cpp(2KB)
--------introspect.h(307B)
--------smem_ops.h(623B)
--------skinny.cu(6KB)
--------skinny.h(235B)
--------permute.cu(4KB)
--------openmp.h(220B)
--------reduced_math.h(2KB)
--------util.h(511B)
--------smem_shuffle.cu(1KB)
--------timer.cu(439B)
--------timer.h(161B)
--------gcd.h(91B)
----LICENSE(15KB)
----extras()
--------python()
--------mkl()
--------tuning()
----README.md(752B)
----config()
--------build-env.py(8KB)
--------nvcc.py(5KB)
--------dox.py(1KB)
----SConstruct(2KB)
----test()
--------rotate.cu(3KB)
--------benchmark.cu(2KB)
--------openmp.cpp(3KB)
--------SConscript(213B)
--------skinny.cu(2KB)
--------permute.cu(2KB)
--------util.h(1KB)