文件名称:Speaker-Recognition-System:EEC 201最终项目
文件大小:1.09MB
文件格式:ZIP
更新时间:2024-04-08 09:30:16
MATLAB
说话人识别系统 团队:视听 珍妮弗·达卡奈(Majeia Reagle) EEC 201最终项目 抽象的 该项目演示了如何使用数字信号处理来创建一个系统,该系统通过使用梅尔频率倒谱系数(MFCC)提取独特的语音特征来自动识别说话者,并演示了LBG算法的有效性。每个扬声器的MFCC功能都是使用LBG算法(K均值聚类)计算的,该算法生成最初以一个质心开始的代码本。该系统首先通过创建密码本来训练识别每个说话者,然后通过确定最接近每个说话者的距离进行测试。系统识别出的扬声器精度为97.2%。 介绍 通过首先计算FFT功率谱并应用梅尔间隔的滤波器组以获得N个能量来计算MFCC。从N个能量中,计算出产生MFCC的对数滤波器组能量的离散余弦变换(DCT)(通常约为10,我们选择7效率最高)。 DCT应用于滤波器组能量(FBE),以解除相关并获得大致不相关的MFCC。 程序 该系统是在Matlab中创建
【文件预览】:
Speaker-Recognition-System-main
----src()
--------main_plots.m(8KB)
--------mfcc.m(866B)
--------src(1B)
--------Dothelifting.m(1KB)
--------train.m(1KB)
--------keepsound.m(543B)
--------closword.m(909B)
--------dista.m(412B)
--------finaldsp.m(7KB)
--------melfb_own.m(1KB)
--------test.m(2KB)
--------plotfilt.m(899B)
----README.md(9KB)
----Data()
--------Test_Data()
--------Training_Data()
----img()
--------results_notch2.jpg(67KB)
--------spectrum_prefiltered_s5.jpg(68KB)
--------periodogram512.jpg(39KB)
--------clusters_s4s8.jpg(36KB)
--------periodogram128.jpg(39KB)
--------spectrum_beforenafter_mel_s5.jpg(83KB)
--------s5_timedomain.JPG(66KB)
--------results.jpg(38KB)
--------mfcc_space.jpg(43KB)
--------melfilterbanks.jpg(39KB)
--------results_notch1.jpg(50KB)
--------s11_timedomain.jpg(64KB)
--------periodogram256.jpg(43KB)
--------periodograms5.jpg(108KB)
--------photos(1B)
--------mfcc_s5.jpg(32KB)
--------spectrogram_s5.jpg(48KB)