文件名称:segan:TensorFlow中的语音增强生成对抗网络
文件大小:253KB
文件格式:ZIP
更新时间:2024-02-25 16:36:23
deep-neural-networks deep-learning tensorflow speech gan
SEGAN:语音增强生成对抗网络 介绍 这是SEGAN项目的存储库。 我们的原始文件可以在找到,并且测试样本可以。 在这项工作中,采用了一种对抗性生成方法,以一种完全卷积的体系结构来进行语音增强(即从损坏的语音信号中去除噪声),如下所示: 该模型处理处于不同SNR的许多噪声条件下的原始语音波形(训练时为40,测试时为20)。 它还可以对来自混合在同一结构中的许多说话者的语音特征进行建模(无需任何身份监督),这使得生成的结构在噪声和说话者维度上具有普遍性。 所有项目都是使用TensorFlow开发的。 关于GAN的定义和部署,有两个很好的参考资料库: GAN:实施改进以更稳定的方式训练G
【文件预览】:
segan-master
----cfg()
--------e2e_maker.cfg(82B)
----bnorm.py(2KB)
----ops.py(14KB)
----train_segan.sh(1KB)
----clean_wav.sh(759B)
----main.py(6KB)
----model.py(36KB)
----requirements.txt(63B)
----prepare_data.sh(2KB)
----generator.py(12KB)
----assets()
--------segan_g.png(83KB)
--------g_adv_loss.png(73KB)
--------g_l1_loss.png(72KB)
----LICENCE(1KB)
----README.md(4KB)
----.gitignore(1KB)
----data_loader.py(1KB)
----discriminator.py(4KB)
----make_tfrecords.py(5KB)