CycleGAN-VC3:Voice Conversion by CycleGAN (语音克隆语音转换):CycleGAN-VC3

时间:2024-05-04 19:06:27
【文件属性】:

文件名称:CycleGAN-VC3:Voice Conversion by CycleGAN (语音克隆语音转换):CycleGAN-VC3

文件大小:388KB

文件格式:ZIP

更新时间:2024-05-04 19:06:27

pytorch gan voice-conversion cyclegan voice-cloning

CycleGAN-VC3-PyTorch | 该代码是PyTorch的纸上实现: ,这是有关语音转换/语音克隆的工作。 数据集 风投 用法 训练 例子 演示版 参考 循环GAN-VC3 非并行语音转换(VC)是一种无需使用并行语料库即可学习源语音和目标语音之间的映射的技术。 最近,CycleGAN-VC [3]和CycleGAN-VC2 [2]在此问题上已经显示出令人鼓舞的结果,并已被广泛用作基准测试方法。 但是,由于CycleGAN-VC / VC2对mel谱图转换的有效性不明确,即使比较方法采用mel谱图作为转换目标,它们也通常用于mel-cepstrum转换。 为了解决这个问题,我们研究了CycleGAN-VC / VC2对梅尔谱图转换的适用性。 通过初步实验,我们发现它们的直接应用损害了在转换过程中应保留的时频结构。 为了解决这个问题,我们提出了CycleGAN-V


【文件预览】:
CycleGAN-VC3-main
----melgan_vocoder.py(4KB)
----feature_utils.py(2KB)
----LICENSE(1KB)
----README.md(5KB)
----tfan_module.py(4KB)
----misc()
--------wechat_pay.png(157KB)
--------ali_pay.png(232KB)
----model.py(21KB)

网友评论