文件名称:wav2letter_pytorch:使用PyTorch的Wav2Letter语音转文本模型的实现
文件大小:28KB
文件格式:ZIP
更新时间:2024-06-09 11:51:08
Python
Wav2Letter_pytorch 使用PyTorch实现Wav2Letter。 基于架构创建网络,并接受CTC损失培训。 特征 极简主义的代码,被设计成一个白盒子-深入研究代码! 训练端到端ASR模型,包括Wav2Letter和Jasper。 使用轻松配置和使用 使用简化培训 与kenlm语言模型集成的波束搜索解码。 安装 安装Python 3.6或更高版本。 克隆存储库(或下载存储库)并根据需求文件进行安装。 pip install -r requirements.txt 用法 LibriSpeech示例 运行examples/librispeech.sh下载并准备数据,并使用单个脚本开始培训。 您可以使用data/prepare_librispeech.py脚本准备Librispeech数据集的其他子集。 使用--help运行它以获取更多信息。 训练 最简单的例子:
【文件预览】:
wav2letter_pytorch-master
----jasper.py(15KB)
----unit_tests()
--------decoder_test.py(3KB)
--------__init__.py(25B)
----train.py(1KB)
----requirements.txt(323B)
----novograd.py(5KB)
----examples()
--------check_requirements.py(272B)
--------librispeech.sh(818B)
----configuration()
--------model()
--------config.yaml(577B)
--------audio()
--------optimizer()
----README.md(4KB)
----data()
--------__init__.py(50B)
--------label_sets.py(681B)
--------augmentations.py(3KB)
--------language_specific_tools.py(697B)
--------data_loader.py(7KB)
--------prepare_librispeech.py(3KB)
----.gitignore(2KB)
----base_asr_models.py(4KB)
----wav2letter.py(4KB)
----decoder.py(13KB)