文件名称:gtensor:GTensor是用于混合GPU开发的多维数组C ++ 14仅标头库
文件大小:114KB
文件格式:ZIP
更新时间:2024-04-25 18:44:19
C++
张量 gtensor是用于混合GPU开发的多维数组C ++ 14仅标头库。 它受启发,旨在支持融合代码的GPU端口。 特征: 多维数组和数组视图,可轻松与Fortran和推力互操作 根据阵列操作自动生成GPU内核 通过惰性评估定义复杂的可重用操作。 这允许以不同的方式组合操作,并作为单个内核评估一次 只需最少使用#ifdef,即可在同一代码库中轻松支持仅CPU和GPU-CPU混合代码。 类似于numpy的多维数组切片 通过CUDA为nVidia提供GPU支持,通过HIP / ROCm为AMD提供AMD支持,通过SYCL提供实验性的Intel GPU支持。 [实验] C库cgtensor,带有围绕常见GPU操作(分配和取消分配,设备管理,内存复制和设置)的包装器 [实验性]围绕GPU BLAS,LAPACK和FFT例程的轻量级包装。 执照 gtensor已获得3条款BSD许可的许可。
【文件预览】:
gtensor-master
----.github()
--------workflows()
----gtensor-config.cmake.in(2KB)
----run-gtests.sh(423B)
----ci()
--------jlse()
----benchmarks()
--------CMakeLists.txt(129B)
--------ij_deriv.cxx(17KB)
----src()
--------cgtensor.cxx(2KB)
--------cgtblas.cxx(7KB)
----.clang-format(3KB)
----CMakeLists.txt(15KB)
----examples()
--------src()
--------CMakeLists.txt(2KB)
--------Makefile(2KB)
----LICENSE(1KB)
----README.md(15KB)
----tests()
--------test_complex.cxx(7KB)
--------test_clib.cxx(3KB)
--------test_assign.cxx(2KB)
--------test_device_backend.cxx(1KB)
--------test_blas.cxx(8KB)
--------test_launch.cxx(5KB)
--------test_lapack.cxx(12KB)
--------test_wip.cxx(362B)
--------test_reductions.cxx(5KB)
--------test_gtensor_span.cxx(3KB)
--------test_debug.h(2KB)
--------test_expression.cxx(7KB)
--------test_gtensor.cxx(18KB)
--------test_space.cxx(3KB)
--------CMakeLists.txt(2KB)
--------test_gtensor_storage.cxx(7KB)
--------test_sarray.cxx(3KB)
--------test_cblas.cxx(6KB)
--------test_adapt.cxx(1KB)
--------test_span.cxx(2KB)
--------test_thrust_ext.cxx(3KB)
--------test_helpers.h(828B)
--------test_view.cxx(16KB)
--------test_fft.cxx(8KB)
--------test_helper.cxx(8KB)
----.gitignore(17B)
----include()
--------gt-fft()
--------gtensor()