文件名称:hcBLAS:该存储库已弃用。 请使用rocBLAS
文件大小:6.22MB
文件格式:ZIP
更新时间:2024-06-04 06:41:26
C++
这是ROCm的实验性BLAS实现,并且已弃用。 请使用 。 A.简介: 该存储库托管基于HCC的BLAS库(hcBLAS),该库的目标是GPU加速AMD设备上传统BLAS例程集的GPU加速。 。 要了解HCC编译器的功能,请参考。 以下列表列举了目前支持的BLAS子例程集。 Sgemm:单精度实值通用矩阵矩阵乘法 Dgemm:双精度实值通用矩阵矩阵乘法 Cgemm:单精度复数值通用矩阵-矩阵乘法 Zgemm:双精度复数值通用矩阵-矩阵乘法 Hgemm:半精度通用矩阵矩阵乘法。 Sgemv:单精度实值通用矩阵向量乘法 Dgemv:双精度实值通用矩阵向量乘法 Sger:单精度通用矩阵秩1运算 Dger:Double Precision General矩阵1级运算 Saxpy:单精度比例向量X并加到向量Y上 Daxpy:双精度比例向量X并加到向量Y上 缩放比例:向量X的单精度缩放比例 D