文件名称:espresso:Espresso:快速的端到端神经语音识别工具包
文件大小:3.66MB
文件格式:ZIP
更新时间:2024-03-15 19:51:26
python end-to-end pytorch speech-recognition kaldi
浓咖啡 Espresso是基于深度学习库和流行的神经机器翻译工具的开源,模块化,可扩展的端到端神经自动语音识别(ASR)工具包。 Espresso支持在GPU和计算节点之间进行分布式训练,并具有ASR中常用的各种解码方法,包括基于超前单词的语言模型融合,为此实现了快速,并行的解码器。 我们为以下语音数据集提供最新的培训食谱: 什么是新的: 2020年6月:发布了变压器配方。 2020年4月:现已支持 (使用 )和混合ASR的交叉熵训练。 和分别提供WSJ配方作为示例。 2020年3月:支持SpecAugment并发布了相关配方。 2019年9月:我们正在努力将Espresso与fairseq隔离开来,从而产生一个可以直接pip install的独立软件包。 要求和安装 版本> = 1.5.0 Python版本> = 3.6 要训练新型号,您还需要NVIDIA GPU和