文件名称:说话人识别
文件大小:10.64MB
文件格式:ZIP
更新时间:2021-05-01 08:26:29
matlab
目前,大部分的说话人识别模型是基于MFCC的混合高斯模型,MFCC包含语音频率结构的时间变化信息,相对稳定,但不同的说话人之间容易相互模仿,本论文针对MFCC的易模仿性,增加了另一种特征参数,基音周期,基因周期包含了语音频率结构信息,虽然会受到说话人健康状况的影响,但不容易模仿。本文将二者结合用于说话人识别。同时,针对常规直接对高斯混合模型进行解混导致识别速度慢这一缺点,本文提出先用DTW计算语音样本间基音周期的最短距离,再用GMM的方法计算测试样本在得分小的前几个训练样本中分布的最大似然概率。实验表明,这种DTW和GMM相结合的说话人识别模型在提高识别准确率和缩短识别时间上都有着显著性的改进。