文件名称:基于音素分割的随机音素分割模型语音识别
文件大小:222KB
文件格式:PDF
更新时间:2024-07-19 14:55:27
学术 论文
使用基于音素分割的随机音素段模型进行语音识别 使用基于音素分割的随机音素段模型的语音识别 古一千子、相泽桂和井上和彦工学院,横滨东印大学,1614 Kurogane, Midori, Yokohama, Ja pan -8502 概要 本文讨论了基于新的统计音素段模型的语音识别,该模型通过从自动提取的音素段派生的音素参数进行训练。 建议的系统如下操作。 在识别前的预处理中,通过分割来检测音素边界。 使用随机音素段模型区分音素,并构建带有分数的音素段格。 接下来,通过将符号序列与字典项进行匹配来执行语音识别。 采用的分割系统可以高精度地推断音素边界。 这有助于消除不必要的参数,留下有效分离音素的特征参数。 换句话说,连续语音中的音素识别问题可以简化为判别问题,因此可以从相对较少的训练数据中构建与说话人无关的模型。 随机音素段模型使用从 10 个说话者所说的 4920 个词的音素平衡词集中提取的训练样本进行训练。 在对 63 位非训练说话者说出的 6709 个单词进行的识别实验中,使用 212 个单词的词典,对所有说话者的平均识别率为 92.6%。 :copyright: 2000 Scr