how-to-optimize-gemm

时间:2024-06-01 01:35:47
【文件属性】:

文件名称:how-to-optimize-gemm

文件大小:2.19MB

文件格式:ZIP

更新时间:2024-06-01 01:35:47

matrix-multiplication gemm code-optimization gotoblas blis

如何优化Gemm Wiki页面 Robert van de Geijn教授( )版权所有。 改编自Github Markdown Wiki,作者( )。 目录 重复相同的优化 进一步优化 阻塞以保持性能 打包到连续内存中 致谢 相关链接 BLISlab:优化GEMM的沙箱 GEMM:从纯C到SSE优化的微内核 致谢 该材料部分由美国国家科学基金会(ACI-1148125 / 1340293和ACI-1550493)赞助。 本材料中表达的任何观点,发现和结论或建议均为作者的观点,不一定反映美国国家科学基金会(NSF)的观点。


【文件预览】:
how-to-optimize-gemm-master
----figures()
--------compare_MMult1_MMult2.png(47KB)
--------graph_7_vs_9.png(25KB)
--------compare_MMult-1x4-6_MMult-4x4-6.png(49KB)
--------compare_MMult-1x4-4_MMult-1x4-5.png(47KB)
--------compare_MMult0_MMult-1x4-9.png(48KB)
--------compare_MMult-1x4-8_MMult-1x4-9.png(52KB)
--------compare_MMult0_MMult1.png(47KB)
--------compare_MMult-1x4-3_MMult-1x4-4.png(47KB)
--------compare_MMult-4x4-3_MMult-4x4-4.png(47KB)
--------graph_2_vs_3.png(25KB)
--------graph_3_vs_4.png(25KB)
--------compare_MMult-4x4-14_MMult-4x4-15.png(54KB)
--------compare_MMult-1x4-7_MMult-4x4-7.png(53KB)
--------graph_10_vs_11.png(25KB)
--------compare_MMult-4x4-11_MMult-4x4-12.png(50KB)
--------compare_MMult0_MMult-4x4-13.png(51KB)
--------compare_MMult0_MMult-4x4-10.png(54KB)
--------compare_MMult-1x4-3_MMult-4x4-3.png(48KB)
--------compare_MMult0_MMult-4x4-15.png(52KB)
--------compare_MMult-4x4-10_MMult-4x4-11.png(58KB)
--------compare_MMult0_MMult_4x4_15.png(25KB)
--------compare_MMult-4x4-13_MMult-4x4-15.png(54KB)
--------compare_MMult-4x4-13_MMult-4x4-14.png(53KB)
--------compare_MMult2_MMult-1x4-3.png(47KB)
--------compare_MMult2_MMult-4x4-3.png(47KB)
--------graph_8_vs_10.png(24KB)
--------compare_MMult-1x4-4_MMult-4x4-4.png(47KB)
--------compare_MMult-1x4-9_MMult-4x4-10.png(57KB)
--------compare_MMult-4x4-7_MMult-4x4-8.png(51KB)
--------compare_MMult0_vs_MMult0.png(60KB)
--------graph_7_vs_8.png(24KB)
--------compare_MMult0_MMult-4x4-11.png(51KB)
--------graph_1_vs_2.png(25KB)
--------graph_6_vs_7.png(26KB)
--------compare_MMult-4x4-4_MMult-4x4-5.png(45KB)
--------compare_MMult-4x4-6_MMult-4x4-7.png(53KB)
--------graph_4_vs_5.png(26KB)
--------compare_MMult0_MMult2.png(47KB)
--------compare_MMult-4x4-12_MMult-4x4-13.png(52KB)
--------compare_MMult-4x4-5_MMult-4x4-6.png(48KB)
--------compare_MMult0_MMult-4x4-5.png(44KB)
--------compare_MMult-4x4-9_MMult-4x4-10.png(58KB)
--------compare_MMult-4x4-8_MMult-4x4-9.png(51KB)
--------compare_MMult-4x4-11_MMult-4x4-13.png(54KB)
--------compare_MMult-1x4-5_MMult-4x4-5.png(45KB)
--------compare_MMult0_MMult0.png(46KB)
--------compare_MMult-4x4-13_MMult_4x4_15.png(26KB)
--------compare_MMult-1x4-3_MMult-1x4-5.png(47KB)
--------compare_MMult0_MMult-1x4-5.png(46KB)
--------graph_8_vs_9.png(24KB)
--------compare_MMult-1x4-5_MMult-1x4-6.png(49KB)
--------compare_MMult-1x4-6_MMult-1x4-7.png(52KB)
--------graph_5_vs_6.png(26KB)
--------compare_MMult-1x4-7_MMult-1x4-8.png(53KB)
----src()
--------MMult_4x4_14.c(6KB)
--------MMult_4x4_5.c(3KB)
--------MMult_1x4_5.c(2KB)
--------MMult_4x4_6.c(4KB)
--------MMult_4x4_15.c(6KB)
--------MMult_1x4_6.c(2KB)
--------MMult_1x4_7.c(2KB)
--------MMult_4x4_11.c(5KB)
--------HowToOptimizeGemm()
--------MMult_4x4_3.c(3KB)
--------MMult_4x4_12.c(5KB)
--------MMult_1x4_8.c(3KB)
--------HowToOptimizeGemm.tar.gz(4KB)
--------MMult_4x4_8.c(4KB)
--------MMult_1x4_3.c(2KB)
--------MMult_1x4_4.c(2KB)
--------MMult_4x4_4.c(4KB)
--------MMult_1x4_9.c(3KB)
--------MMult1.c(1KB)
--------MMult_4x4_13.c(5KB)
--------MMult_4x4_10.c(4KB)
--------MMult_4x4_7.c(4KB)
--------MMult2.c(2KB)
--------MMult_4x4_9.c(4KB)
----README.md(2KB)

网友评论