文件名称:warp-rnnt:CUDA-Warp RNN-换能器
文件大小:42KB
文件格式:ZIP
更新时间:2024-05-26 08:26:36
cuda warp forward-backward rnn-transducer Python
CUDA-Warp RNN-换能器 一个GPU实现RNN换能器(格雷夫斯 , )。 该代码是从移植的(由Awni Hannun编写),并且充分利用了CUDA warp机制。 损失的主要瓶颈是基于动态规划算法的前进/后退。 特别是,存在一个嵌套循环,用于填充形状为(T,U)的晶格,并且该晶格中的每个值都取决于每个维度上的前两个像元(例如, )。 CUDA以32个并行线程(称为组的形式执行线程。 当warp的所有32个线程都在其执行路径上达成一致时,便可以实现全部效率。 这正是用于优化RNN换能器的方法。 晶格在T维度上分为扭曲。 在每个扭曲中,线程之间的变量使用快速操作进行交换。 当前经线填满最后一个值后,接下来的两个经线(t + 32,u)和(t,u + 1)开始运行。 下图显示了向前通过的示意性过程,其中T-帧数,U-标签数,W-翘曲尺寸。 向后传递的类似过程并行运行。 表现 In
【文件预览】:
warp-rnnt-master
----core.cu(11KB)
----core_gather.cu(10KB)
----tensorflow_binding()
--------core.cu(10B)
--------core_gather.cu(17B)
--------tests()
--------src()
--------core.h(9B)
--------transducer_tensorflow()
--------setup.py(5KB)
--------CMakeLists.txt(2KB)
--------README.md(3KB)
----LICENSE(1KB)
----lattice.gif(22KB)
----core.h(957B)
----README.md(5KB)
----pytorch_binding()
--------MANIFEST.in(85B)
--------core.cu(10B)
--------core_gather.cu(17B)
--------benchmark.py(2KB)
--------LICENSE(10B)
--------core.h(9B)
--------requirements.txt(28B)
--------setup.py(2KB)
--------binding.cpp(4KB)
--------README.md(2KB)
--------warp_rnnt()