CoviDSP

时间:2024-04-06 08:58:14
【文件属性】:

文件名称:CoviDSP

文件大小:1.34MB

文件格式:ZIP

更新时间:2024-04-06 08:58:14

MATLAB

CoviDSP :speaker_high_volume: :studio_microphone: 最终项目:说话人识别系统 详细说明: Howard Kao-hkao [at] ucdavis [dot] edu William Orozco-worozco [在] ucdavis [点] edu EEC201-加州大学戴维斯分校。 2021年冬季季度 A.引言 该项目的目的是建立一个自动的说话人识别系统。 通过对信号应用傅立叶变换,从输入语音中提取特征,然后获得梅尔频率倒谱系数(MFCC)。 音频信号的特性会随时间变化。 因此,应用加窗和短时傅立叶变换可以方便地找到具有有用信息的区域,并隔离无用的扇区。 特征提取后,我们准备使用LBG算法计算质心。 它们是每个发言者的代码簿的代码字。 最后,我们通过识别不同数据集中的说话者来测试系统。 待办事项:添加流程图 B.数据预处理 在特征提取过程之前,对信号进行分析以获得诸如形状,幅度,均值,噪声和安静区


【文件预览】:
CoviDSP-main
----LICENSE(34KB)
----src()
--------img()
--------Test()
--------normAudio.m(313B)
--------melfb.m(1KB)
--------lbg.m(3KB)
--------disteu.m(771B)
--------Train()
--------mfcc_own.m(1KB)
--------CoviDSP1.m(11KB)
----README.md(6KB)

网友评论