文件名称:deepvoice3_pytorch:基于卷积神经网络的文本到语音合成模型的PyTorch实现
文件大小:6.72MB
文件格式:ZIP
更新时间:2024-02-23 22:12:02
python machine-learning end-to-end pytorch tts
Deepvoice3_pytorch 基于卷积网络的文本到语音合成模型的PyTorch实现: :深度语音3:通过卷积序列学习将文本转换为语音。 :基于深度卷积网络并具有指导性注意力的高效可训练的文本语音转换系统。 音频示例可从。 民间 :具有WORLD声码器支持的DeepVoice3。 在线TTS演示 可以在上执行的笔记本可用: 强调 卷积序列到序列模型,用于文本到语音合成 DeepVoice3的多扬声器和单扬声器版本 音频样本和预训练模型 用于 , 和数据集以及兼容的自定义数据集(JSON格式) 取决于语言的英语和日语前端文本处理器 样品 预训练模型 注意:预训练的模型与母版不兼容。 即将更新。 网址 模型 数据 超参数 Git提交 脚步 深度语音3 LJSpeech 64万 Nyanko LJSpeech builder=nyanko,preset=nyanko_ljspeech 585k 多扬声器DeepVoice3 VCTK builder=deepvoice3_multispeaker,preset=deepvoice3_vctk 300k