文件名称:matlab识别代码-vggvox-speaker-identification:使用VGGVox网络识别说话人
文件大小:64MB
文件格式:ZIP
更新时间:2024-06-27 13:43:49
系统开源
matlab识别代码视频 VGGVox说话人识别模型的Python适配,基于Nagrani et al 2017,《》 仅评估代码,基于作者和 . 指示 安装python3和所需的包 修改cfg/enroll_list.csv和cfg/test_list.csv以指向您本地的注册/测试 wav 文件 运行评估: python3 scoring.py 结果将存储在res/results.csv 。 每行都有格式: [path to test wav], [correct speaker], [distance to enroll speaker 1],...[distance to enroll speaker N], [predicted speaker], [correct?]
【文件预览】:
vggvox-speaker-identification-master
----.gitignore(1KB)
----data()
--------model()
--------wav()
----wav_reader.py(1KB)
----cfg()
--------enroll_list.csv(124B)
--------test_list.csv(85B)
----sigproc.py(6KB)
----constants.py(412B)
----README.md(776B)
----scoring.py(3KB)
----model.py(4KB)