文件名称:ctc_beam_search_lm:CTC+Beam_Search+kenlm 是用于以汉字为声学模型建模单元的解码系统
文件大小:37.97MB
文件格式:ZIP
更新时间:2024-05-30 04:45:06
beam-search chinese-characters asr kenlm C++
此为百度第二代语音识别解码方案C++版本 CTC+BeamSearch+LM 1 ctc_beam_search_decoder.cpp中相关的解码参数 num_frames:为wav的帧数 num_classes:为分类的数目,比如建模单元为多少个汉字 beam_size:beam的大小 blank_id:ctc训练时,blank的id cutoff_prob:为概率剪枝参数 alpha:为语言模型权重系数 beta:为句子长度系数 输入:经声学模型后的softmax概率prob.txt,以及相应的字表vocab.txt 输出:解码结果 2 编译ctc_beam_search_decoder.cpp 1)开始编译: ./compile_decoder.sh 3 运行解码 ./ctc_beam_search_decoder 4 解码结果