文件名称:tacotron:具有预训练模型的Google Tacotron语音合成的TensorFlow实现(非官方)
文件大小:34KB
文件格式:ZIP
更新时间:2024-02-25 10:53:30
python machine-learning tensorflow tts speech-synthesis
塔科创 Tastron语音合成在TensorFlow中的实现。 音频样本 使用此存储库训练的模型中的。 第一组在上接受了441K步的训练大约2万步后,语音开始变得清晰。 第二组由在上进行了140K步训练。 最近更新 @npuichigo了一个错误,该错误未在prenet中应用辍学。 @begeekmyfriend创建了一个,以添加对位置敏感的注意以及论文中的stop令牌。 这可以大大减少训练模型所需的数据量。 背景 2017年4月,谷歌发表了论文《 ,他们提出了一种神经文本到语音模型,该模型可以学习直接从(文本,音频)对中合成语音。 但是,他们没有发布源代码或培训数据。 这是对他们的论
【文件预览】:
tacotron-master
----synthesizer.py(1KB)
----train.py(6KB)
----models()
--------helpers.py(3KB)
--------tacotron.py(8KB)
--------__init__.py(174B)
--------rnn_wrappers.py(2KB)
--------modules.py(3KB)
----TRAINING_DATA.md(3KB)
----hparams.py(1KB)
----text()
--------cmudict.py(2KB)
--------numbers.py(2KB)
--------__init__.py(2KB)
--------cleaners.py(2KB)
--------symbols.py(630B)
----requirements.txt(300B)
----datasets()
--------datafeeder.py(6KB)
--------__init__.py(0B)
--------blizzard.py(3KB)
--------ljspeech.py(3KB)
----util()
--------infolog.py(1KB)
--------__init__.py(444B)
--------audio.py(5KB)
--------plot.py(463B)
----LICENSE(1KB)
----eval.py(2KB)
----README.md(7KB)
----demo_server.py(3KB)
----tests()
--------__init__.py(0B)
--------text_test.py(2KB)
--------numbers_test.py(2KB)
--------cmudict_test.py(1KB)
----.gitignore(45B)
----preprocess.py(2KB)