文件名称:sgemm_hsw:这是Intel Haswell上的sgemm实现
文件大小:20KB
文件格式:ZIP
更新时间:2024-06-01 01:01:47
Assembly
sgemm_hsw 这是Intel Haswell上的sgemm实现。 测试环境:Intel Core i3 4130 @ 3.4GHz。 使用一个核心。 Haswell理论峰值性能:3.4GHz *(8 * 2 + 8 * 2)= 108.8 GFLOPS。 测试结果:AVX调整版本检查结果:平均错误:0.000000e + 00,最大错误:0.000000e + 00,最小错误:0.000000e + 00。 FMA调整的版本检查结果:平均错误:2.911187e-08,最大错误:2.509359e-07,最小错误:0.000000e + 00。 天真版本:时间= 110.623981s,性能= 2.096546 GFLOPS。 AVX调整版本:时间= 4.353230s,性能= 53.277275 GFLOPS。 FMA调整版本:时间= 2.203727s,性能= 105.2
【文件预览】:
sgemm_hsw-master
----sgemm_gen.cpp(3KB)
----main.c(5KB)
----LICENSE(34KB)
----sgemm_kernel.s(86KB)
----README.md(627B)
----build.sh(191B)
----sgemm_kernel.h(190B)