文件名称:wenet:生产优先和生产就绪的端到端语音识别工具包
文件大小:2.4MB
文件格式:ZIP
更新时间:2024-03-31 01:03:56
pytorch transformer speech-recognition automatic-speech-recognition production-ready
微网 | | | | 我们一起共享神经网络。 WeNet的主要动机是缩小研究与生产端到端(E2E)语音识别模型之间的差距,减少生产E2E模型的工作量,并探索用于生产的更好的E2E模型。 强调 生产至生产准备就绪:WeNet的python代码符合TorchScript的要求,因此由WeNet训练的模型可以由Torch JIT直接导出,并使用LibTorch进行推理。 研究模型和生产模型之间没有差距。 模型推断既不需要模型转换也不需要其他代码。 流和非流ASR的统一解决方案:WeNet实施框架,以实现准确,快速和统一的端到端模型,有利于行业采用。 可移植的运行时:将提供几个演示,以演示如何在不同的平台(包括服务器和设备上的上托管经过WeNet训练的模型。 轻巧:WeNet是专为端到端语音识别而设计的,代码简洁明了。 它全部基于PyTorch及其相应的生态系统。 它不依赖Kald