文件名称:基于i-vector去噪的说话人识别研究
文件大小:269KB
文件格式:RAR
更新时间:2021-05-01 10:34:39
说话人识别
说话人识别系统在嘈杂的环境中性能会大大降低,为了处理这个强大的限制,我们的目标是直接在i向量空间中去除i向量的噪声部分。我们的方法提供了仅在i矢量提取水平下操作的优点,使系统的其他步骤不变。应用最大后验(MAP)程序以获得干净版本的噪声i矢量,利用关于干净的i向量分布的先验知识。为了执行该MAP估计,对干净的噪声i向量分布进行高斯假设。我们显示出与基准系统相比,所提出的方法的效率是以相对较高的计算成本为代价获得的。最后提出一些想法来改进这方面的内容
【文件预览】:
ivector_denoising-master
----ivector_denoising-master()
--------README.md(302B)
--------ADDITIVE NOISE COMPENSATION IN THE I-VECTOR SPACE FOR SPEAKER.pdf(280KB)
--------estimate_denoised_ivectors.m(913B)