文件名称:ctc-process:CTC流程模型
文件大小:371KB
文件格式:ZIP
更新时间:2024-03-11 20:34:51
Python
ctc进程 使用CTC和VAE的组合训练ASR系统,该系统允许进行非自回归的端到端预测。 安装 运行python setup.py develop 数据准备 使用来自Kaldi的DNN预先配置来预处理数据并从数据集中提取音频特征。 对于WSJ,您需要下载以下语料库: LDC93S6B LDC94S13B 训练 运行wsj_train.py或librispeech_train.py --config配置文件,请参阅conf目录中的示例文件。 --model-dir目录,用于保存/加载/恢复模型数据 --train-data-dir目录,包含训练数据 --eval-data-dir目录,包含评估数据