voclone:U-GAT-IT背景注入的实现,用于分离语音转换GAN的噪声

时间:2021-04-06 11:42:27
【文件属性】:
文件名称:voclone:U-GAT-IT背景注入的实现,用于分离语音转换GAN的噪声
文件大小:19.14MB
文件格式:ZIP
更新时间:2021-04-06 11:42:27
Python U-GAT-IT —官方PyTorch实施 :具有图像到图像转换的自适应层实例规范化的无监督生成注意网络 | 本文的结果来自Tensorflow代码 U-GAT-IT:具有图像到图像转换的自适应层实例规范化的无监督生成注意网络 摘要我们提出了一种新的无监督图像到图像翻译方法,该方法以端到端的方式结合了新的注意力模块和新的可学习归一化功能。 注意力模块指导我们的模型将注意力集中在基于辅助分类器获得的注意力图来区分源域和目标域的更重要区域上。 与以前的基于注意力的方法无法处理域之间的几何变化不同,我们的模型可以转换需要整体变化的图像和需要大形状变化的图像。 此外,我们新的AdaLIN(自适应层实例归一化)功能可帮助我们的注意力引导模型通过根据数据集学习的参数灵活地控制形状和纹理的变化量。 实验结果表明,与现有的具有固定网络架构和超参数的最新模型相比,该方法具有优越性。 用法 ├── datas
【文件预览】:
voclone-main
----UGATIT_old.py(34KB)
----UGATIT.py(52KB)
----ablation-none.sh(1KB)
----ablation-bgdis.sh(1KB)
----dis-on-all-checkpoints.sh(2KB)
----ablation-geninject-bgdis.sh(1KB)
----mel_utils.py(26B)
----utils.py(2KB)
----iterseq.py(24B)
----run-mel.sh(333B)
----ablation-disinject.sh(1KB)
----main.py(12KB)
----voclone-ablation-examples()
--------disinject()
----requirements.txt(1KB)
----dataset.py(5KB)
----ablation-disinject-bgdis.sh(1KB)
----ablation-geninject.sh(1KB)
----LICENSE(1KB)
----README.md(3KB)
----train-mel.sh(6KB)
----test-mel.sh(3KB)
----voclone-tools()
--------allinone.sh(3KB)
--------check_mels.py(1KB)
--------wav2mel.sh(516B)
--------mel_utils.py(8KB)
--------iterseq.py(6KB)
--------make_intervals.py(19KB)
--------TODO.txt(13KB)
--------voice-detector.py(5KB)
--------synthwaveglow.py(4KB)
--------resample-wavs.sh(513B)
--------ref()
--------mel2img.py(2KB)
--------test_add_mels.py(2KB)
--------voice-detector.sh(222B)
----gen-on-all-checkpoints.sh(2KB)
----.gitignore(43B)
----networks.py(10KB)

网友评论