【文件属性】:
文件名称:kaldi-german:训练Kaldi进行德语语音识别(ASR)的脚本
文件大小:19KB
文件格式:ZIP
更新时间:2021-05-22 15:29:07
speech-recognition speech-to-text asr german-speech-recognition Shell
使用Kaldi的德语语音识别
用于训练Kaldi模型以进行德语语音识别的脚本。
数据/ LM /词典
首先,我们必须获取数据,语言模型和词典。
要获取数据,请遵循的步骤。
从下载LM。
从下载该词典。
准备
在训练之前,必须通过执行脚本prepare.sh来完成数据,词典和lm的prepare.sh 。 为了做到这一点,必须使用pip install -r requirements安装一些python依赖项。
./prepare.sh \
[german-asr-data]/data/full_waverized \
[lexicon] \
[sequitur-model] \
[lm]
训练
准备之后,完成实际的培训。 在此步骤中,使用kaldi。 要运行它,最简单的方法是使用的docker映像。 所有命令都在run.sh 。 该脚本源自位于eg
【文件预览】:
kaldi-german-master
----conf()
--------online_cmvn.conf(95B)
--------mfcc_hires.conf(670B)
--------online_pitch.conf(2KB)
--------decode.config(39B)
--------mfcc.conf(48B)
----prepare.sh(521B)
----RESULTS(464B)
----cmd.sh(871B)
----run_example.sh(343B)
----local()
--------prepare_dict.py(3KB)
--------nnet3()
--------prepare_data.py(2KB)
--------chain()
--------score.sh(6KB)
----requirements.txt(93B)
----run.sh(8KB)
----path.sh(740B)
----.gitignore(36B)
----README.md(2KB)
----utils(27B)
----steps(27B)