vad函数matlab代码-tf-kaldi-speaker:基于Kaldi和Tensorflow的神经说话人识别/验证系统

时间:2024-06-09 07:29:04
【文件属性】:

文件名称:vad函数matlab代码-tf-kaldi-speaker:基于Kaldi和Tensorflow的神经说话人识别/验证系统

文件大小:575KB

文件格式:ZIP

更新时间:2024-06-09 07:29:04

系统开源

vad函数matlab代码由于版权问题,我只能发布在2019年1月之前开发的单个GPU版本。一些实现也需要改进,例如GPU内存分配。 该库仍可以用作说话者验证的框架。 多GPU和其他方法可以用更少的精力添加。 注意当您使用extract.sh提取发言人嵌入时,请确保TensorFlow是在没有MKL的情况下编译的。 据我所知,anaconda安装的TF的某些版本是使用MKL编译的。 当TF在CPU上运行时,它将使用多个线程。 如果您运行多个进程(例如40),这将是有害的。 线程冲突将使提取极其缓慢。 对我来说,我使用pip安装TF 1.12,并且可以正常工作。 概述 tf-kaldi-speaker使用和实现了基于神经网络的说话者验证系统。 主要思想是,可以使用Kaldi进行预处理和后期处理,而TF是构建神经网络的更好选择。 与Kaldi nnet3相比,使用TF进行网络修改(例如,增加注意力,使用不同的损失函数)的成本更低。 还可以添加其他功能来支持与文本相关的说话者验证。 该项目的目的是使基于神经网络的说话人验证的研究更加容易。 我还尝试在论文中重现一些结果。 要求 Python:


网友评论