ncnn-with-cuda:腾讯NCNN增加了CUDA支持

时间:2024-06-16 05:08:32
【文件属性】:

文件名称:ncnn-with-cuda:腾讯NCNN增加了CUDA支持

文件大小:11.71MB

文件格式:ZIP

更新时间:2024-06-16 05:08:32

C++

该项目为著名的推理引擎实现了GPU NVIDIA CUDA推理支持。 NVIDIA Jetson系列设备上的许多Edge AI项目都可以从此支持中受益。 发展状况 当前在CUDA中实现了以下几层: AbsVal,BatchNorm,Bias,BinaryOp,BNLL,Concat,卷积,ConvolutionDepthWise,裁剪,展平,内部产品,输入,包装,填充,合并,量化,ReLU,重塑,Softmax,拆分 近期发展计划: Cuda实现的层为Eltwise,HardSigmoid,HardSwish,Interp,Scale,Yolov3DetectionOutput 进一步优化现有CUDA层(以击败Vulkan性能为目标;)) 对于缺少某些CUDA层实现的用例,CPU / GPU数据乒乓会大大降低执行速度。 Develop分支用于主动开发。 新层的开发是在develop


网友评论