Lab 4: Code Optimization

时间:2013-12-01 07:53:39
【文件属性】:

文件名称:Lab 4: Code Optimization

文件大小:1.97MB

文件格式:RAR

更新时间:2013-12-01 07:53:39

Lab 4: Code Optimization

Lab 4: Code Optimization


【文件预览】:
l4.pdf
lab4
----l4.pdf(827KB)
----miss_score(2KB)
----defs.h(754B)
----cprof()
--------cacheprof(429KB)
--------cachesim.o(12KB)
--------cacheprof_hooks1_x86.s(331B)
--------bin()
--------cacheprof_hooks2_x86.s(4KB)
--------cacheann(659KB)
--------cacheprof.hs(25KB)
--------makefile(3KB)
--------cachegen.hs(5KB)
--------cachegen(362KB)
--------cacheprint.hs(27KB)
--------cacheann.hs(46KB)
--------staticfm.hs(4KB)
--------cachesim.c(12KB)
--------license(18KB)
--------generics.hs(5KB)
--------cacheprint(573KB)
--------arch_x86.hs(13KB)
----rotate.c(3KB)
----Makefile(2KB)
myimplementation
----rotate_cache.c(1KB)
----rotate.c(1KB)
----smooth.c(4KB)
www.pudn.com.txt

网友评论

  • 里面对于rotate函数的优化写了两个版本,较复杂的一个修改对于大规模矩阵测试性能很好; 而对rotate函数进行简单的函数展开优化的那一个版本有点不太明白,为什么dst[RIDX(dim-1-i,j,dim)] = src[RIDX(j,i,dim)];展开测试性能有提高,而dst[RIDX(dim-1-j,i,dim)] = src[RIDX(i,j,dim)];展开的性能却没有什么提升 难道我测试的有问题?