文件名称:tacorn:20182019 TTS框架集成了最先进的开源方法
文件大小:298KB
文件格式:ZIP
更新时间:2024-04-09 04:08:04
JupyterNotebook
警告:此存储库是一个实验,不再进行维护。 玉米角 TTS框架融合了不同的2018/2019最新技术的开源方法。目前的目的是在Tacotron-2执行由Rayhane-mamah(结合 )与由fatchord替代WaveRNN实施方式的叉( )。总体目标是更轻松地允许换出单个组件。 介绍 语音合成系统由多个组件组成,这些组件传统上是手动开发的,并且越来越多地被机器学习模型取代。 在这里,我们定义了统计参数语音合成中使用的三个组件。我们不考虑单元选择或混合单元选择系统或基于物理模型的系统。 数据沿着这些组件流动,产生中间表示,然后将其输入到下一个组件。虽然在训练中我们通常处理大型数据集,并且中间表示形式通常存储在硬盘上,但我们希望在合成时避免这种情况,并希望将所有内容保存在内存中。 文字分析 从文本输入生成语言规范的组件。 传统上,这涉及手工编码的语言特定规则,发音词典,字典外单词的字母到声
【文件预览】:
tacorn-master
----.gitignore(1KB)
----install.sh(242B)
----LICENSE(1KB)
----synthesize.py(2KB)
----README.md(6KB)
----wavernn()
--------requirements.txt(32B)
--------hyperparams.py(3KB)
--------__init__.py(0B)
--------LICENSE(1KB)
--------model_wrnn.py(7KB)
--------synthesize.py(4KB)
--------lrschedule.py(1KB)
--------distributions.py(7KB)
--------utils.py(3KB)
--------README.md(4KB)
--------loss_function.py(316B)
--------preprocess.py(4KB)
--------dataset.py(5KB)
--------playground.ipynb(401KB)
--------audio.py(3KB)
--------model.py(20KB)
--------train.py(10KB)
----tests()
--------experiment_test.py(977B)
--------tacotron2_wrapper_test.py(1KB)
----config()
--------hparams.py(14KB)
----preprocess.py(2KB)
----create.py(4KB)
----train.py(2KB)
----tacorn()
--------tacotron2_wrapper.py(7KB)
--------experiment.py(4KB)
--------wavernn_wrapper.py(6KB)
--------__init__.py(0B)
--------wrappers.py(150B)
--------wavernn_alt_wrapper.py(6KB)
--------constants.py(548B)
--------fileutils.py(1KB)