文件名称:tacotronv2_wavernn_chinese:tacotronV2 + wavernn 实现中文语音合成(Tensorflow + pytorch)
文件大小:158.96MB
文件格式:ZIP
更新时间:2024-05-04 03:17:39
Python
TacotronV2 + WaveRNN update at 2020-10-3 添加微调分支 开源中文语音数据集(女声)训练中文,实现中文到声学特征(Mel)转换的声学模型。在GTA模式下,利用训练好的TacotronV2合成标贝语音数据集中中文对应的Mel特征,作为声码器的训练数据。在合成阶段,利用TactornV2和WaveRNN合成高质量、高自然度的中文语音。 从任选一个speaker的语音数据集,微调TacotronV2中的部分参数,实现说话人转换。 Tensorflow serving + Flask 部署TacotronV2中文语音合成服务。 由于中采用Location sensitive attention,对长句字的建模能力不好(漏读、重复),尝试了、、,能有效地解决对长句的建模能力,加快模型收敛速度。 tensorflow-gpu的版本为1.14.0 测试语音合成的效果
【文件预览】:
tacotronv2_wavernn_chinese-master
----logs_wavernn()
--------checkpoints()
----.gitignore(2KB)
----images()
--------website.png(163KB)
--------post_result.png(102KB)
----requirements.txt(318B)
----wavernn_hparams.py(2KB)
----website()
--------app()
--------run.py(71B)
--------README.md(1KB)
----logs-Tacotron-2()
--------taco_pretrained()
----.DS_Store(6KB)
----tacotron_synthesize.py(10KB)
----tacotron_hparams.py(19KB)
----tacotron_preprocess.py(5KB)
----README.md(8KB)
----tacotron_model_export.py(2KB)
----demo()
--------04-forward-griffin_lim-speaker-adaptive.wav(18.27MB)
--------04-graves-griffin_lim.wav(20.68MB)
--------03-forward-griffin_lim-speaker-adaptive.wav(178KB)
--------03-graves-griffin_lim.wav(180KB)
--------03-forward-wavernn.wav(346KB)
--------04-forward-griffin_lim.wav(17.24MB)
--------03-forward-griffin_lim.wav(173KB)
--------demo.html(386B)
--------05-forward-griffin_lim.wav(442KB)
--------01-graves-griffin_lim.wav(711KB)
--------02-forward-griffin_lim-speaker-adaptive.wav(896KB)
--------D8_766.mp3(32KB)
--------02-graves-griffin_lim.wav(1MB)
--------README.md(8KB)
--------01-forward-griffin_lim-speaker-adaptive.wav(670KB)
--------05-forward-wavernn.wav(883KB)
--------01-forward-wavernn.wav(1.29MB)
--------02-forward-griffin_lim.wav(845KB)
--------02-forward-wavernn.wav(1.65MB)
--------01-forward-griffin_lim.wav(663KB)
----wavernn()
--------models()
--------utils()
----wavernn_train.py(6KB)
----tacotron_train.py(3KB)
----tacotron()
--------datasets()
--------models()
--------synthesize.py(5KB)
--------utils()
--------pinyin()
--------synthesizer.py(6KB)
--------feeder.py(7KB)
--------train.py(11KB)
----wavernn_gen.py(5KB)
----wavernn_preprocess.py(6KB)
----index.html(14KB)
----train.txt(1.93MB)
----read_checkpoint.py(531B)