speech_separation:约束置换不变训练,语音分离

时间:2024-06-14 22:44:27
【文件属性】:

文件名称:speech_separation:约束置换不变训练,语音分离

文件大小:3.41MB

文件格式:ZIP

更新时间:2024-06-14 22:44:27

speech-separation constrained-pit Python

约束置换不变训练,语音分离 请引用: 徐成林,饶伟,肖雄,Ch昂崇和李海洲,“使用网格LSTM对单个通道语音进行分离,并限制了其对钢琴水平的渗透性,”,Proc。 见ICASSP 2018,第6-10页。 徐成林,饶伟,Ch昂崇和李海洲,“使用多任务学习进行单声道语音分离的移位Delta系数目标”,Proc。 INTERSPEECH 2018,第3479-3483页。 资料产生 如果您使用wsj0-2mix重复论文1和2,请使用的代码生成wsj0_2mix数据 语音分离 当前,该代码仅实现两个扬声器的分离,如果您有更多的扬声器需要分离,请相应地修改输出部分和掩码估计。 发言者信息的数量需要事先知道,这限制了语音分离在实践中的应用。 我们完成了另一项工作,即目标说话人提取。 它只是从混合或嘈杂的环境中提取目标说话者的声音。 请参考 。 run.sh脚本包括功能提取,建模训练和运行时推


【文件预览】:
speech_separation-master
----data()
--------wsj0_2mix()
----model()
--------__init__.pyc(145B)
--------model.pyc(8KB)
--------__init__.py(0B)
--------model.py(10KB)
----extract_feats.py(7KB)
----utils()
--------__init__.pyc(144B)
--------paddedFIFO_batch.pyc(3KB)
--------audioread.pyc(681B)
--------__init__.py(0B)
--------sigproc.py(6KB)
--------sigproc.pyc(7KB)
--------audioread.py(394B)
--------normhamming.pyc(672B)
--------read_list.pyc(1KB)
--------comp_dynamic_feature.py(1KB)
--------paddedFIFO_batch.py(3KB)
--------normhamming.py(384B)
--------comp_dynamic_feature.pyc(2KB)
--------read_list.py(1KB)
----README.md(2KB)
----run.sh(5KB)
----decode.py(9KB)
----train.py(12KB)

网友评论