vad函数matlab代码-tf-kaldi-speaker:Kaldi和Tensorflow的集成以训练基于神经网络的说话者验证系统

时间:2024-06-09 07:28:57
【文件属性】:

文件名称:vad函数matlab代码-tf-kaldi-speaker:Kaldi和Tensorflow的集成以训练基于神经网络的说话者验证系统

文件大小:508KB

文件格式:ZIP

更新时间:2024-06-09 07:28:57

系统开源

vad函数matlab代码更新2020/4/14 我注意到VoxSRC 2020开始了。 该存储库可用作此挑战的基准。 就像我说的,使用ResNet-18 + softmax可以得到1.8%的EER,这是一个很好的结果(使用〜5900个扬声器训练集并在vox1测试集上进行测试)。 只需使用AMSoftmax损失,尝试更深层次的网络,添加新的合并方法(例如自我注意)并实现高级结构(例如挤压和激励),我希望可以取得更好的结果。 享受培训:-) 更新2019/11/19 添加了多GPU培训。 可以在配置文件中指定GPU的数量。 有关更多详细信息,请参见示例,例如egs / voxceleb / v3 / run.sh。 添加一个标准的VoxCeleb示例,该示例使用egs / voxceleb / v2(使用tdnn)和v3(使用resnet)中的官方培训列表(即VoxCeleb2开发集)。 添加一个简单的ResNet + softmax示例,使用官方培训列表,该示例在VoxCeleb1测试集中的EER达到1.8%。 由于我们使用数据并行性,因此每步数据和梯度都会在GPU之间分布。 当使用过


网友评论