文件名称:speech:语音到文本的端到端模型的PyTorch实现
文件大小:112KB
文件格式:ZIP
更新时间:2024-05-18 11:51:50
Python
演讲
语音是一个开放源代码包,用于构建用于自动语音识别的端到端模型。 当前支持关注的序列到序列模型,连接器时间分类和RNN序列转换器。
该软件的目的是促进语音识别的端到端模型的研究。 这些模型在PyTorch中实现。
该软件仅在Python3.6中经过测试。
我们不会为Python2.7提供向后兼容性。
安装
我们建议创建一个虚拟环境并在其中安装python要求。
virtualenv
【文件预览】:
speech-master
----.gitignore(1KB)
----README.md(2KB)
----eval.py(2KB)
----tests()
--------seq2seq_test.py(1KB)
--------io_test.py(767B)
--------shared.py(625B)
--------test0.wav(38KB)
--------loader_test.py(958B)
--------test1.wav(53KB)
--------ctc_test.py(901B)
--------test.json(532B)
--------model_test.py(638B)
--------wave_test.py(303B)
----examples()
--------.gitignore(13B)
--------timit()
--------librispeech()
--------wsj()
----train.py(4KB)
----LICENSE(11KB)
----setup.sh(207B)
----requirements.txt(199B)
----Makefile(349B)
----speech()
--------utils()
--------models()
--------__init__.py(82B)
--------loader.py(5KB)