文件名称:gantts:基于GAN的文本到语音合成和语音转换(VC)的PyTorch实现
文件大小:8.73MB
文件格式:ZIP
更新时间:2024-05-12 10:06:31
speech-synthesis gan voice-conversion generative-adversarial-net nnmnkwii
甘孜 基于生成对抗网络(GAN)的文本到语音(TTS)和语音转换(VC)的PyTorch实现。 生成的音频样本 音频示例可在Jupyter笔记本中的以下链接中找到: 有关超级参数的注意事项 adversarial_streams是表示语音质量敏感的参数,代表用于计算对抗损失的流(mgc,lf0,vuv,bap)。 计算基于mgc功能的对抗性损失(前几个维度除外)似乎效果很好。 如果mask_nth_mgc_for_adv_loss > 0,则在计算对抗损失时将忽略mgc的第一个mask_nth_mgc_for_adv_loss维度。 如,我确认使用第0(和第1)mgc来计算对抗性损失会影响语音质量。 根据我的经验, mask_nth_mgc_for_adv_loss订单25的mask_nth_mgc_for_adv_loss = 1,mgc订单59的mask_nth_mg
【文件预览】:
gantts-master
----.travis.yml(958B)
----.gitmodules(104B)
----release.sh(584B)
----evaluation_tts.py(12KB)
----nnmnkwii_gallery()
----tts_demo.sh(2KB)
----data()
--------.gitignore(14B)
----.github()
--------stale.yml(1KB)
----train.py(34KB)
----prepare_features_vc.py(4KB)
----tests()
--------test_gantts.py(5KB)
----tox.ini(110B)
----gantts()
--------models.py(8KB)
--------__init__.py(148B)
--------multistream.py(4KB)
--------seqloss.py(1KB)
----train_gan.sh(4KB)
----generated()
--------.gitignore(14B)
----hparams.py(6KB)
----setup.py(2KB)
----LICENSE.md(1KB)
----.gitignore(2KB)
----README.md(7KB)
----evaluation_vc.py(6KB)
----notebooks()
--------Test TTS.ipynb(4.58MB)
--------Test RNN VC.ipynb(3.8MB)
--------Test VC.ipynb(3.77MB)
----prepare_features_tts.py(9KB)
----vc_demo.sh(1KB)