文件名称:N-R法matlab代码-Single-speaker-localization:基于CNN的单个说话人本地化
文件大小:149.37MB
文件格式:ZIP
更新时间:2024-06-09 22:23:41
系统开源
NR法matlab代码使用CNN进行单扬声器本地化 该存储库提供了与本文中介绍的基于CNN的单源本地化方法相关的受过训练的模型 职称: 作者:, 会议: 2017年IEEE音频和声学信号处理应用研讨会(WASPAA)。 但是,与本文描述的声学和阵列几何设置存在一些差异。 在尝试运行代码之前,应记住一些主要区别,如下所示: 麦克风之间的距离为0.08 m。 STFT窗口长度修改为512个样本,从而提供16 ms的特征速率。 相位图尺寸为:4x256,不包括最低频率子带。 一个小型测试数据集,具有特征(相位图)和目标,是通过将13 s长的语音信号与来自[8,8,8,8,8的4个中间麦克风的9个不同角度的实测RIR进行卷积而创建的,8,8]包含ULA设置( DOA_test.hdf5 )以及输出.mat文件( DOA_test_OP.mat )。 请注意,Bar-Ilan数据集中的角度约定与我们的不同。 为了解决这个问题,将数据集中的原始地面真相角转换为我们的惯例。 下图显示了Bar-Ilan约定,如示例代码所示。 方括号中是与我们的约定相对应的角度。 所有角度均以度为单位。 +------
【文件预览】:
Single-speaker-localization-master
----Weights_mul_CNN.h5(33.42MB)
----DOA_test_OP.mat(1.03MB)
----Model_mul_CNN_paper.json(4KB)
----Model_sin_CNN.json(4KB)
----Weights_sin_CNN.h5(32.85MB)
----Model_mul_CNN.json(4KB)
----requirements.txt(38B)
----DOA_test.hdf5(59.06MB)
----Weights_mul_CNN_paper.h5(33.29MB)
----README.md(6KB)
----DOA_est_Vis_github.m(1KB)
----cnn_test_github.py(1KB)