文件名称:vad函数matlab代码-tf-kaldi-speaker-master:tf-kaldi扬声器大师
文件大小:12.69MB
文件格式:ZIP
更新时间:2024-06-09 07:29:11
系统开源
vad函数matlab代码概述 tf-kaldi-speaker使用和实现了基于神经网络的说话者验证系统。 主要思想是,可以使用Kaldi进行预处理和后期处理,而TF是构建神经网络的更好选择。 与Kaldi nnet3相比,使用TF进行网络修改(例如,增加注意力,使用不同的损失函数)的成本更低。 还可以添加其他功能来支持与文本相关的说话者验证。 该项目的目的是使基于神经网络的说话人验证的研究更加容易。 我还尝试在论文中重现一些结果。 要求 Python:2.7(更新到3.6 / 3.7应该很容易。) 卡尔迪:> 5.5 由于Kaldi仅用于进行预处理和后期处理,因此大多数版本> 5.2均可使用。 尽管我不确定100%,但我相信支持x向量的Kaldi(例如egs / sre16 / v2)就足够了。 但是,如果要运行egs / voxceleb,请确保您的Kaldi也包含此示例。 Tensorflow:> 1.4.0 我一开始就使用TF 1.4.0编写代码。 然后我更新到v1.12.0。 将来的版本将支持TF> 1.12,但是我将尝试使API与较低版本兼容。 由于API的更改(例如,某些