文件名称:Speaker-Recognition-System:EEC201最终项目
文件大小:278KB
文件格式:ZIP
更新时间:2024-04-06 23:54:34
MATLAB
说话人识别系统 EEC201最终项目 团队成员:钱伟泰,Ata Vafi 抽象的 该项目建立了一个依靠少量样本的说话人识别系统。它主要具有3个阶段的流水线:(1)特征提取(2)特征学习(3)说话人识别。在特征提取阶段,使用海明窗尺寸为256的短时傅立叶变换(STFT)。然后将20个滤波器用于MFCC以生成20维训练向量。在特征提取之后,使用矢量量化和k均值聚类来学习这些特征。在使用陷波滤波器生成更多噪声数据集之前,该系统在训练集上达到100%的精度,在测试集上达到100%的精度。 介绍 方法 首先,由于音频幅度不包含用户的任何唯一信息,因此将幅度标准化为[-1,1]范围。接下来,对信号的主要部分进行削波,并对削波后的信号执行短时离散傅立叶变换。在stft中,语音信号被阻塞为N个样本的重叠帧:第一个帧由前N个样本组成。第二帧在第一帧之后开始M个采样,并与N-M个采样重叠,以此类推。N和M为N
【文件预览】:
Speaker-Recognition-System-main
----image()
--------pipeline.PNG(48KB)
--------MFCC.png(33KB)
--------MFCC_40.png(195KB)
----src()
--------main.m(1KB)
--------compute_Distortion.m(649B)
--------Mel_Spectrum.m(238B)
--------Frame_Blocking.m(266B)
--------training.m(693B)
--------LBG.m(1KB)
--------melfb.m(1KB)
--------plot_2DClustering.m(2KB)
--------disteu.m(771B)
--------find_NearestCentroid.m(918B)
--------hamming_window.m(157B)
--------clustering_2Dtest.m(804B)
--------testing.m(2KB)
--------find_threshold.m(786B)
--------update_Centroids.m(812B)
--------expand_Codebook.m(577B)
--------MFCC.m(721B)
----README.md(3KB)