cotatron:Cotatron @ INTERSPEECH 2020的官方代码

时间:2024-06-03 22:40:15
【文件属性】:

文件名称:cotatron:Cotatron @ INTERSPEECH 2020的官方代码

文件大小:15.12MB

文件格式:ZIP

更新时间:2024-06-03 22:40:15

pytorch speech-synthesis voice-conversion Python

Cotatron —官方PyTorch实施 签出我们的新项目:通过组装现代语音合成技术实现逼真的语音转换 Cotatron:转录指导语音编码器,用于无并行数据的多对多语音转换朴胜元,金斗英, -chul Joe @ SNU, 论文: : (将出现在INTERSPEECH 2020中) 音频样本: : 更新:使用享受我们预先训练的模型! 摘要:我们提出了Cotatron,这是一种转录引导语音编码器,用于独立于说话者的语言表示。 Cotatron基于多扬声器TTS体系结构,可以使用常规TTS数据集进行训练。 我们训练了一个语音转换系统,以重构具有Cotatron功能的语音,这与基于语音后验图(PPG)的先前方法类似。 通过使用来自VCTK数据集的108位说话者进行训练和评估我们的系统,我们在自然性和说话者相似性方面均优于以前的方法。 我们的系统还可以转换培训期间看不见的说话


网友评论