matlab由频域变时域的代码-speaker-recognition:说话人识别

时间:2024-06-10 12:28:46
【文件属性】:

文件名称:matlab由频域变时域的代码-speaker-recognition:说话人识别

文件大小:2.8MB

文件格式:ZIP

更新时间:2024-06-10 12:28:46

系统开源

matlab由频域变时域的代码EEC-201 [说话者识别] ♪我周围都是熟悉的面Kong..但是现在他们是熟悉的声音...♫ 团队:敬业的工程师 这个项目是由Aakansha和Sadia共同完成的,目的是使用MFCC,VQ和LBG算法来实现说话人识别。 Sadia从事过预加工和MFCC。 Aakansha从事LBG,噪声添加和陷波过滤方面的工作。 培训,测试和分析写作是同时进行的。 介绍 在当今世界大流行和隔离的情况下,从字面上看,我们的声音变得越来越重要。 由于通信仅限于虚拟,因此通过面对面或通过指纹进行的身份验证已经过时。 但是,正如我们的脸部和指纹独特一样,我们的声音也具有鲜明而可区分的特征。 如我们的项目所示,计算机程序比人耳能够更好地识别这些功能。 我们使用模式识别或特征匹配实现说话人识别系统,其中将从输入语音信号中提取的声学矢量序列分类为各个说话人ID。 具体来说,我们的系统是监督模式识别的一种实现,其中数据库由训练集中的已知模式组成,这些模式与测试集进行比较以评估我们的分类算法。 有两种方法可以进行说话人识别-依赖文本和不依赖文本。 依赖于文本的说话者识别策略要求说话者


【文件预览】:
speaker-recognition-main
----Source Code()
--------main.m(2KB)
--------mfcc.m(3KB)
--------LBG.m(2KB)
--------train.m(889B)
--------kmeans.m(1KB)
--------test.m(2KB)
--------disteu.m(771B)
--------add_noise.m(601B)
--------preProcressing.m(1KB)
--------melfb.m(1KB)
----README.md(21KB)
----Images()
--------normalized_speech_signal_speaker_1.PNG(27KB)
--------MFCC Speaker1_2.PNG(41KB)
--------sig1 MFCC cluster1.PNG(16KB)
--------sig1 stft_3.PNG(66KB)
--------sig1 stft_2.PNG(68KB)
--------sig1 MFCC.PNG(26KB)
--------mel scale equation.jpeg(9KB)
--------speech_signal_speaker_1.PNG(27KB)
--------sig1 MelFreqWrap.PNG(26KB)
--------sig1 sig2 MFCC clusters.PNG(21KB)
--------results.PNG(7KB)
--------Normalized_Silence removed sig1.PNG(56KB)
--------sig1 stft_1.PNG(67KB)
--------20 mel filter banks.PNG(39KB)
--------stft sig1_before Mel.PNG(143KB)
--------sig1 N_512.PNG(87KB)
--------sig1 N_256.PNG(89KB)
--------noiseaddedsig1.PNG(34KB)
--------sig1 N_128.PNG(90KB)
--------VQ acoustic vector codeblocks.PNG(21KB)
--------mfcc5_6 speaker1_2.PNG(23KB)
--------noisechart.PNG(448KB)
----Audio()
--------Training()
--------Self Audio()
--------Test()

网友评论