文件名称:matlab终止以下代码-EEC201_Speaker_Recognition:本和克里斯蒂安针对EEC201的最终项目
文件大小:1.24MB
文件格式:ZIP
更新时间:2024-06-10 04:47:59
系统开源
matlab终止以下代码EEC201_Speaker_Recognition 否TwoB团队 运行项目的说明## 要运行我们的项目,请下载文件final_project_run_this.zip并运行TwoB_or_NotTooB.m脚本。 确保将训练文件夹添加到路径。 抽象的 我们的项目通过基于文本的MFCC特征提取来实现说话人识别系统。 对于说话人分类,我们使用了LBG算法,它是K-Means聚类的扩展,它从单个质心开始迭代生成聚类。 背景 我们的总体目标是建立一个系统,该系统可以根据给定说话者的培训信息来识别该说话者的声音。 我们的系统基于文本-即通过特定的代码字或简短的培训短语来培训说话者。 由于我们的语音信号在每个讲话者语音的共振峰之外包含无关的信息,因此这一过程变得很复杂,这可能会干扰训练和分类的过程。 为了了解从信号中去除哪些障碍信息(预处理),我们必须首先从信号处理的角度了解人声的组成。 人的声音 所显示的标签标识了有助于语音表达的所有成分 说话人声音的共振峰受每个说话人声道的频率响应影响最大。 语音中涉及的其他组件难以识别,并且会模糊在声道中获得的信息。我们可以通过以
【文件预览】:
EEC201_Speaker_Recognition-main
----disteu.m(773B)
----README.md(18KB)
----Final_Project_Run_This.zip(614KB)
----Clustering_Example.png(25KB)
----Screenshot 2021-03-18 235357.png(20KB)
----LICENSE(1KB)
----Matching.png(4KB)
----lbg.m(3KB)
----MFCC.png(132KB)
----TwoB_or_NotTooB.m(2KB)
----melfb.m(1KB)
----melfb_own.m(5KB)
----train.m(2KB)
----Test_and_Train_Data.zip(480KB)