文件名称:cgls_cuda:CUDA中最小二乘的共轭梯度
文件大小:12KB
文件格式:ZIP
更新时间:2024-06-01 12:37:51
Cuda
CUDA中最小二乘的共轭梯度 这是用于稀疏矩阵的的CUDA实现。 CGLS解决了问题 minimize ||Ax - b||_2^2 + s ||x||_2^2, 通过使用(CG)。 与仅将CG应用于法线方程相比,它在数值上更稳定。 该实现支持实值和复值矩阵,CSR和CSC格式以及单精度和双精度的任意组合。 另外,可以使用用于计算Ax和A^Tx抽象运算符来代替稀疏矩阵。 ####表现 CGLS在Nvidia Tesla K40c上中的两个最大的非平方矩阵上运行。 矩阵名称 尺寸 非零 Iter。 时间 时间/(iter * nnz) 吉安.mesh_grid (230k,9k) 85万 794 0.52秒 0.77纳秒 JGD_GL7d.GL7d18 (200万,150万) 3600万 77 3.7秒 1.3纳秒 〜U [-1,1] (1M,950k) 250M
【文件预览】:
cgls_cuda-master
----Makefile(163B)
----gen_test_data.m(480B)
----cgls.cuh(22KB)
----cgls_test.cu(12KB)
----README.md(5KB)