文件名称:分布式并行计算:SJTU CS433分布式并行计算课程
文件大小:2.81MB
文件格式:ZIP
更新时间:2024-03-12 06:33:34
Cuda
CS433分布式并行计算课程 此仓库包含一些有关 OpenMP的 卡达 我们的最终项目-优化Caffe 前两个作业很幼稚,但是它们给了我们并行编程的基本感觉,特别是使用CUDA编写内核函数。 正如我们的老师所说,编写高性能CUDA内核功能的能力决定了您能否获得满意的报价! 而且我们的最终项目非常困难。 众所周知,Caffe是最先进的深度学习结构。 尽管这些年来tensorflow和pytorch的使用更为频繁,但您必须将Caffe视为一个很棒的结构,以产生自己的深度学习系统,并借助NVIDIA设计的CUDA内核功能,cudnn和cublas库,获得相当高的性能,并让易于学习的学习者使用。 由于我们仍在从事此项目,因此我们的修改后的代码将在以后推送(大约在2020年1月5日,我们的项目截止日期)。 更新:2020.1.11 现在,我们完成了最终项目“优化Caffe ”的代码。 有一件事
【文件预览】:
Distibuted-Parallel-Computing-master
----src()
--------caffe()
----ReadME.md(4KB)
----dataset()
--------train_lmdb()
--------dataset_mean.binaryproto(588KB)
--------val_lmdb()
----test()
--------inception21k_solver.prototxt(134B)
--------test_mat.cu(1KB)
--------log.txt(7.67MB)
--------train_resnet_101.sh(70B)
--------inception21k_train.sh(72B)
--------inception21k.prototxt(49KB)
--------im2col(641KB)
--------im2col.cu(3KB)
--------test.cu(3KB)
--------resnet_101.prototxt(65KB)
--------gemv.cu(2KB)
--------Makefile(125B)
--------gemm.cu(5KB)
--------vec.out(655KB)
--------rbf.cu(7KB)
--------resnet_101_solver.prototxt(132B)
----include()
--------caffe()