文件名称:tacotron:带有预训练模型的Google Tacotron语音合成的TensorFlow实现
文件大小:43KB
文件格式:ZIP
更新时间:2024-05-30 10:46:22
附件源码 文章源码
塔科创 Tastron语音合成在TensorFlow中的实现。 音频样本 使用此存储库训练的模型中的。 第一组在上接受了877K步的训练 大约2万步后,语音开始变得清晰。 尽管损失继续减少,但在经过约25万步之后,并没有太大的改善。 第二组由在上进行了140K步训练。 背景 2017年4月,谷歌发表了论文《 ,他们提出了一种神经文本到语音模型,该模型可以学习直接从(文本,音频)对中合成语音。 但是,他们没有发布源代码或培训数据。 这是为他们的论文中描述的模型提供开源实现的独立尝试。 它的质量还不如Google的演示好,但是希望它有一天会达到:-)的水平。 拉请求是欢迎的! 快速开始 安装依赖 安装Python 3。 为您的平台安装最新版本的 。 为了获得更好的性能,请安装GPU支持(如果有)。 该代码可用于TensorFlow 1.3及更高版本。 安装要求: pip ins
【文件预览】:
tacotron-master
----synthesizer.py(1KB)
----train.py(6KB)
----models()
--------helpers.py(5KB)
--------tacotron.py(8KB)
--------__init__.py(174B)
--------rnn_wrappers.py(10KB)
--------custom_decoder.py(5KB)
--------modules.py(3KB)
--------attention.py(9KB)
----TRAINING_DATA.md(3KB)
----hparams.py(1KB)
----text()
--------cmudict.py(2KB)
--------numbers.py(2KB)
--------__init__.py(2KB)
--------cleaners.py(2KB)
--------symbols.py(630B)
----requirements.txt(300B)
----datasets()
--------datafeeder.py(6KB)
--------__init__.py(0B)
--------blizzard.py(3KB)
--------ljspeech.py(3KB)
----util()
--------infolog.py(1KB)
--------__init__.py(444B)
--------audio.py(5KB)
--------plot.py(463B)
----LICENSE(1KB)
----eval.py(2KB)
----README.md(6KB)
----demo_server.py(3KB)
----tests()
--------__init__.py(0B)
--------text_test.py(2KB)
--------numbers_test.py(2KB)
--------cmudict_test.py(1KB)
----.gitignore(45B)
----preprocess.py(2KB)