文件名称:Cotatron
文件大小:139.27MB
文件格式:ZIP
更新时间:2024-04-19 23:27:16
JupyterNotebook
Cotatron —官方PyTorch实施 Cotatron:转录指导语音编码器,用于无并行数据的多对多语音转换朴胜元,金斗英, -chul Joe @ SNU, 论文: : (将出现在INTERSPEECH 2020中) 音频样本: : 更新:使用享受我们经过预先训练的模型! 摘要:我们提出了Cotatron,这是一种转录导向的语音编码器,用于独立于说话者的语言表示。 Cotatron基于多扬声器TTS体系结构,可以使用常规TTS数据集进行训练。 我们训练了一个语音转换系统,以重构具有Cotatron功能的语音,这与基于语音后验图(PPG)的先前方法类似。 通过使用来自VCTK数据集的108位说话者进行训练和评估我们的系统,我们在自然性和说话者相似性方面均优于以前的方法。 我们的系统还可以转换培训期间看不见的说话人的语音,并利用ASR自动转录,而对性能的影响最小。 音