End-to-End-Speech-Recognition-Models:自动语音识别模型的 PyTorch 实现

时间:2024-06-17 23:50:20
【文件属性】:

文件名称:End-to-End-Speech-Recognition-Models:自动语音识别模型的 PyTorch 实现

文件大小:41KB

文件格式:ZIP

更新时间:2024-06-17 23:50:20

end-to-end pytorch transformer las vad

端到端语音识别模型 此存储库包含端到端自动语音识别模型。此存储库不包含训练或音频或文本预处理代码。 如果您想查看模型以外的代码,请参阅。 许多语音识别开源包含所有与训练相关的代码,很难只看到模型结构。 所以我只为我实现的模型创建了一个存储库,并将它们公开。 我将继续添加我实现的语音识别模型。 实施清单 深度演讲 2 达里奥 Amodei 等。 肖恩纳伦。 听、听、拼(修改版) 威廉·陈等人。 Takaaki Hori 等。 IBM。 克洛瓦伊。 语音转换器Ashish Vaswani 等。 赵媛媛等。 开脱旭。 碧玉Jason Li 等人, 英伟达。 深度学习示例 语音活动检测(一维 Resnet 模型) 菲利波吉鲁齐。 voice_activity_detection 故障排除和贡献 如果您有任何问题、错误报告和功能请求,请在 Github 上提出问题。 我感谢任何形式


【文件预览】:
End-to-End-Speech-Recognition-Models-main
----models()
--------deepspeech2()
--------jasper()
--------__init__.py(581B)
--------modules.py(6KB)
--------las()
--------transformer()
--------extractor.py(6KB)
--------vad()
--------attention.py(10KB)
----LICENSE(11KB)
----README.md(3KB)
----.gitignore(207B)

网友评论