文件名称:Tesi_suono
文件大小:36KB
文件格式:ZIP
更新时间:2024-04-05 20:00:27
Python
GST Tacotron(使用全局样式令牌的富有表现力的端到端语音合成) 的张量流实现以及。 音频样本 使用默认超级参数使用此存储库训练的模型中的。 使用带有和不带有全局样式标记(GST)的集进行了训练。 我发现合成音频可以学习参考音频的韵律。 音频质量不如纸质。 也许更多的数据,更多的训练步骤以及Wavenet声码器将改善质量,并改善注意力机制。 快速开始: 安装依赖 安装Python 3。 为您的平台安装最新版本的 。 为了获得更好的性能,请安装GPU支持(如果有)。 该代码可与TensorFlow 1.4一起使用。 安装要求: pip install -r requirements.txt 训练 下载数据集: 开箱即用地支持以下内容: (公共领域) (知识共享署名相同) 我们使用Blizzard 2013数据集来测试此仓库(Google的论文使用了2013 Bl
【文件预览】:
Tesi_suono-main
----.gitignore(87B)
----text()
--------__init__.py(2KB)
--------symbols.py(631B)
--------cleaners.py(2KB)
--------numbers.py(2KB)
--------cmudict.py(2KB)
----requirements.txt(300B)
----datasets()
--------__init__.py(0B)
--------ljspeech.py(3KB)
--------blizzard2013.py(3KB)
--------blizzard.py(3KB)
--------datafeeder.py(6KB)
----eval.py(3KB)
----models()
--------rnn_wrappers.py(3KB)
--------__init__.py(174B)
--------tacotron.py(9KB)
--------multihead_attention.py(5KB)
--------modules.py(4KB)
--------helpers.py(3KB)
--------gmm_attention_wrapper.py(5KB)
----hparams.py(2KB)
----util()
--------plot.py(463B)
--------__init__.py(444B)
--------audio.py(5KB)
--------ops.py(443B)
--------infolog.py(1KB)
----README.md(4KB)
----tests()
--------__init__.py(0B)
--------text_test.py(2KB)
--------numbers_test.py(2KB)
--------cmudict_test.py(1KB)
----preprocess.py(2KB)
----synthesizer.py(3KB)
----train.py(6KB)