speech:语音到文本的端到端模型的PyTorch实现

时间:2024-05-18 11:51:50
【文件属性】:

文件名称:speech:语音到文本的端到端模型的PyTorch实现

文件大小:112KB

文件格式:ZIP

更新时间:2024-05-18 11:51:50

Python

演讲 语音是一个开放源代码包,用于构建用于自动语音识别的端到端模型。 当前支持关注的序列到序列模型,连接器时间分类和RNN序列转换器。 该软件的目的是促进语音识别的端到端模型的研究。 这些模型在PyTorch中实现。 该软件仅在Python3.6中经过测试。 我们不会为Python2.7提供向后兼容性。 安装 我们建议创建一个虚拟环境并在其中安装python要求。 virtualenv source /bin/activate pip install -r requirements.txt 然后按照适用于您的计算机的版本的安装说明进行操作。 安装所有python需求后,从顶层目录运行: make 构建过程需要CMake以及Make。 之后,从仓库根目录获取setup.sh 。 source setup


【文件预览】:
speech-master
----.gitignore(1KB)
----README.md(2KB)
----eval.py(2KB)
----tests()
--------seq2seq_test.py(1KB)
--------io_test.py(767B)
--------shared.py(625B)
--------test0.wav(38KB)
--------loader_test.py(958B)
--------test1.wav(53KB)
--------ctc_test.py(901B)
--------test.json(532B)
--------model_test.py(638B)
--------wave_test.py(303B)
----examples()
--------.gitignore(13B)
--------timit()
--------librispeech()
--------wsj()
----train.py(4KB)
----LICENSE(11KB)
----setup.sh(207B)
----requirements.txt(199B)
----Makefile(349B)
----speech()
--------utils()
--------models()
--------__init__.py(82B)
--------loader.py(5KB)

网友评论