文件名称:matlab代码中的rir-dereverberation-end-to-end:硕士论文库
文件大小:5.35MB
文件格式:ZIP
更新时间:2024-06-27 11:54:48
系统开源
matlab代码中的rir 基于深度神经网络的声强端到端多声道语音去混响 这是我的 . 特征提取 因为特征提取的代码被认为是我实验室的资产,所以不会上传。 该过程可以简要说明: 将 32 通道房间脉冲响应 (RIR) 转换为具有真实球面傅立叶变换基础的球面谐波域 (SHD) 信号。 计算来自语音源的混响 SHD 信号,刚性球模态强度的修正逆 $b^{-1}_n(kr)$,以及 1 的结果。 计算方向特征,瞬时强度向量(论文中的IIV ,python 代码中的IV )。 模型 该模型是 Wave-U-Net 的修改版本。 参考waveunet目录。 train_test.py train_test.py是模型训练或评估的代码。 评估指标 PESQ、STOI 和 fwSegSNR 的源代码在matlab_lib目录中。 SegSNR在实施audio_utils.py