cuda_ann:CUDA 中的神经网络实现(本科毕业项目)

时间:2024-07-08 05:24:06
【文件属性】:

文件名称:cuda_ann:CUDA 中的神经网络实现(本科毕业项目)

文件大小:89.27MB

文件格式:ZIP

更新时间:2024-07-08 05:24:06

C++

GPU 净假设 没有调用内核的主机函数会在最后调用 cudaDeviceSynchronize()。 例如,主机上有一个执行多个内核的反向传播函数。 最后两个是权重更新。 如果立即从不同的流中读取这些权重,则可能需要同步。 反向传播功能不会同步。 笔记: 使用具有 6977 个模式和 361 个输入到 1 个输出的人脸数据集,feed_forward_1_2 需要 29.3051 ms 进行 100 次半迭代,而 feed_forward_2_2 需要 0.604352 ms 进行 100 次半迭代。 这意味着我需要能够在不到 29 毫秒左右的时间内求和才能有所改进。 我在传递指向数组索引的指针时遇到问题,并且仍然使 reduce 内核按预期工作。 NVidia GTX 660 显卡理论峰值带宽 = 规格说 144.2 GB/秒


【文件预览】:
cuda_ann-master
----.project(819B)
----haarcascade_frontalface_default.xml(1.23MB)
----sample_runs()
--------cuda_ann_racecheck.txt(33KB)
--------backprop_debug.txt(4KB)
--------cpu_test.txt(681B)
--------memcheck.txt(53KB)
--------epoch_debug.txt(9KB)
----coalesce.py(317B)
----src()
--------NetData.h(865B)
--------NetIO.cpp(5KB)
--------Net.h(1KB)
--------FeatureVector.h(583B)
--------Profiler.cpp(5KB)
--------GPUNet.h(5KB)
--------TrainingDataSet.h(822B)
--------Net.cpp(7KB)
--------ann.cu(6KB)
--------NetData.cpp(6KB)
--------NetIO.h(601B)
--------GPUNet.cu(60KB)
--------GPUNetSettings.h(757B)
--------NetTrainer.cpp(14KB)
--------NetTrainer.h(2KB)
--------Profiler.h(919B)
----create_and_normalize.sh(177B)
----net_format.txt(251B)
----TODO.md(3KB)
----README.md(877B)
----.cproject(13KB)
----random_dataset.py(1KB)
----Doxyfile(74KB)
----results.ods(23KB)
----feature_selection()
--------plot_rfe_digits.py(615B)
--------feature_extraction.py(3KB)
--------plot_rfe_with_cross_validation.py(1KB)
----tests()
--------GPUNetTests.cpp(3KB)
--------reduction_tests.cpp(1KB)
----.gitignore(641B)
----nvvps()
--------cuda_ann_3-19-14.nvvp(82.19MB)
--------cuda_ann_v3.nvvp(1.73MB)
--------cuda_ann_v3.5_3-4-2014.nvvp(6.59MB)
--------face_overlapped.nvvp(24.27MB)
--------trevor_alan_49_2.nvvp(280KB)
--------some_awesome_overlapping_with_coalesced_access.png(186KB)
--------cuda_ann_v3.3_2-20-14_feedforward2.nvvp(1.58MB)
--------trevor_alan_49_2_noevents.nvvp(273KB)
--------cuda_ann_v3.2_2-18-14.nvvp(203KB)
--------cuda_ann_test_sync.nvvp(2.42MB)

网友评论