【文件属性】:
文件名称:视频图matlab代码-VoxCeleb:VoxCeleb
文件大小:611KB
文件格式:ZIP
更新时间:2021-05-27 15:07:19
系统开源
视频图matlab代码用于说话人识别和验证的VGGVox模型
该目录包含用于导入和评估在(1&2)数据集上预先训练的说话者识别和验证模型的代码,如以下论文(和)中所述:
[1]
A.
Nagrani*,
J.
S.
Chung*,
A.
Zisserman,
VoxCeleb:
a
large-scale
speaker
identification
dataset,
INTERSPEECH,
2017
[2]
J.
S.
Chung*,
A.
Nagrani*,
A.
Zisserman,
VoxCeleb2:
Deep
Speaker
Recognition,
INTERSPEECH,
2018
训练用于验证的模型将语音频谱图映射到一个紧凑的欧几里得空间,其距离直接对应于说话者相似性的量度。
这样的嵌入可用于诸如说话者验证,聚类和二值化之类的任务。
先决条件
[1]
Matlab
[2]。
正在安装
在此vl_contrib使用代码的最简单方法是使用vl_contrib软件包管理器。
要安装,请按照下列步骤操作:
按照以下说明安装和编译matconvnet。
跑步:
vl_cont
【文件预览】:
VoxCeleb-master
----matlab()
--------+dagnn()
--------vl_nnl2norm.m(1KB)
----mfcc()
--------mfccspec.m(7KB)
--------trifbank.m(5KB)
--------vec2frames.m(7KB)
--------runSpec.m(224B)
--------rm_dc_n_dither.m(498B)
----setup_VGGVox.m(258B)
----demo_vggvox_verif.m(2KB)
----demo_vggvox_identif.m(2KB)
----README.md(4KB)
----testfiles()
--------verif()
--------ident()
----demo_vggvox_verif_voxceleb2.m(3KB)
----test_getinput.m(513B)