hifi_gan

时间:2024-02-29 02:00:07
【文件属性】:

文件名称:hifi_gan

文件大小:608KB

文件格式:ZIP

更新时间:2024-02-29 02:00:07

Python

注意:我(@zachwe)没有创建此项目,因此不值得给予任何荣誉。 此配套的全部功劳应归功于Jungil Kong,Jaehyeon Kim,Jaekyoung Bae。 非常感谢他们创建了如此出色的声码器。 我所做的只是打包它,以使其更易于使用。 HiFi-GAN:高效,高保真语音合成的生成对抗网络 江,金在贤,在京裴 在我们的,我们提出了HiFi-GAN:一种能够有效生成高保真语音的基于GAN的模型。 我们在此存储库中将我们的实现和预训练的模型作为开源提供。 摘要:最近有关语音合成的一些工作已经采用了生成对抗网络(GAN)来生成原始波形。 尽管此类方法提高了采样效率和内存使用率,但其采样质量尚未达到自回归和基于流的生成模型的质量。 在这项工作中,我们提出了HiFi-GAN,它可以实现高效和高保真语音合成。 由于语音音频由具有不同周期的正弦信号组成,我们证明了对音频的周期性模式进行建模


【文件预览】:
hifi_gan-master
----hifi_gan()
--------inference.py(3KB)
--------env.py(394B)
--------train.py(12KB)
--------utils.py(1KB)
--------meldataset.py(6KB)
--------models.py(10KB)
--------inference_e2e.py(2KB)
----config_v3.json(752B)
----LJSpeech-1.1()
--------training.txt(2.61MB)
--------validation.txt(30KB)
----validation_loss.png(11KB)
----config_v2.json(762B)
----requirements.txt(113B)
----LICENSE(1KB)
----setup.py(911B)
----README.md(5KB)
----config_v1.json(762B)
----.gitignore(170B)

网友评论