TTS-Cube:递归神经网络的2端到2端语音合成

时间:2024-05-24 17:27:57
【文件属性】:

文件名称:TTS-Cube:递归神经网络的2端到2端语音合成

文件大小:426.38MB

文件格式:ZIP

更新时间:2024-05-24 17:27:57

text-to-speech neural-network speech character lstm

介绍 新的: 可以在 找到使用Google Colaboratory的交互式演示 TTS-Cube是一个端到端的语音合成系统,可提供完整的处理管道来训练和部署TTS模型。 它完全基于神经网络,不需要预先对齐的数据,并且可以通过仅使用字符或音素序列进行训练以产生音频。 Markdown不允许嵌入音频文件。 要获得更好的体验,。 对于安装,请遵循。 培训和用法示例可以在找到。 笔记本演示可以在找到。 输出示例 编码器输出: “在地球一小时内,人们普遍认为互联网是一种普遍使用的互联网应用生态学,这是荒谬的。” “ Pentru违禁品,Rusia违约品,South Stream,要照顾纳布科的合作伙伴。” 声码器输出(以黄金标准数据为条件) 注意:mel频谱以12.5ms的帧移计算。 这意味着Griffin-Lim重建最多会产生草率的结果(无论迭代次数如何) 端到端解码 编码器模


网友评论