文件名称:Neural-Speech-Dereverberation:语音去混响的机器和深度学习模型
文件大小:5.38MB
文件格式:ZIP
更新时间:2024-05-02 03:56:00
speech speech-enhancement dereverberation Python
神经语音去混响 语音去混响的机器和深度学习模型 数据 LibriSpeech用于语音音频文件[1]。 可用: : 用于房间冲激响应(RIR)的Omni和MARDY数据集[2,3]。 可用: : 和 但是,语音@FIT混响数据库用于重发数据[4]。 可用: : 生成的数据可以在这里下载: : 。 这只是模拟数据,对于重传数据,请遵循BUT Speech @ FIT指令 楷模 具有“上下文窗口”的MLP和LSTM 后期混响抑制LSTM [5] FD-NDLP(WPE +频域)[6]。 实施取自 U-net用于语音去混响[7]。 U-net体系结构基于图像分割,可用: : 用U-net生成器进行GAN训练[7] 在此处下载神经网络权重: : //drive.google.com/drive/folders/1wAls6GGppERIFUDEG12gk7zxNBU_i
【文件预览】:
Neural-Speech-Dereverberation-main
----models()
--------sequential_models.py(2KB)
--------unet_parts.py(3KB)
--------__pycache__()
--------convolutional_models.py(3KB)
--------notebooks()
----utils.py(8KB)
----data_generation()
--------Normalize_spectrograms.ipynb(20KB)
--------Generate_spectrograms.ipynb(783KB)
----LICENSE(34KB)
----.idea()
--------Neural-Speech-Dereverberation.iml(284B)
--------misc.xml(185B)
--------vcs.xml(180B)
--------modules.xml(310B)
--------.gitignore(47B)
--------inspectionProfiles()
----reverb_dataset.py(505B)
----example.png(169KB)
----requirements.txt(172B)
----README.md(3KB)
----.gitattributes(112B)