文件名称:视频图matlab代码-VoxCeleb:VoxCeleb
文件大小:611KB
文件格式:ZIP
更新时间:2024-06-16 08:53:59
系统开源
视频图matlab代码用于说话人识别和验证的VGGVox模型 该目录包含用于导入和评估在(1&2)数据集上预先训练的说话者识别和验证模型的代码,如以下论文(和)中所述: [1] A. Nagrani*, J. S. Chung*, A. Zisserman, VoxCeleb: a large-scale speaker identification dataset, INTERSPEECH, 2017 [2] J. S. Chung*, A. Nagrani*, A. Zisserman, VoxCeleb2: Deep Speaker Recognition, INTERSPEECH, 2018 训练用于验证的模型将语音频谱图映射到一个紧凑的欧几里得空间,其距离直接对应于说话者相似性的量度。 这样的嵌入可用于诸如说话者验证,聚类和二值化之类的任务。 先决条件 [1] Matlab [2]。 正在安装 在此vl_contrib使用代码的最简单方法是使用vl_contrib软件包管理器。 要安装,请按照下列步骤操作: 按照以下说明安装和编译matconvnet。 跑步: vl_cont
【文件预览】:
VoxCeleb-master
----matlab()
--------+dagnn()
--------vl_nnl2norm.m(1KB)
----mfcc()
--------mfccspec.m(7KB)
--------trifbank.m(5KB)
--------vec2frames.m(7KB)
--------runSpec.m(224B)
--------rm_dc_n_dither.m(498B)
----setup_VGGVox.m(258B)
----demo_vggvox_verif.m(2KB)
----demo_vggvox_identif.m(2KB)
----README.md(4KB)
----testfiles()
--------verif()
--------ident()
----demo_vggvox_verif_voxceleb2.m(3KB)
----test_getinput.m(513B)