文件名称:Tacotron-2-keras:Tacotron-2的硬实施
文件大小:11KB
文件格式:ZIP
更新时间:2024-06-15 07:36:16
Python
Tacotron-2-keras(无Wavenet声码器) Deep mind的Tacotron-2的Keras实现。 本文描述了一种深度神经网络架构: 当前状态: 编写Tacotron-2的Keras染色(进行中) 在DeepMind的论文的基础上实现高质量的类人文字到语音合成器 实现多GPU系统的高速培训和工作。 提供预训练的Tacotron-2模型 提供与Mozilla 项目的兼容性(可选) 笔记: 我们的预处理仅支持Ljspeech和类似Ljspeech的数据集(M-AILABS语音数据)! 如果在以不同方式存储的数据集上运行,则可能需要制作自己的预处理脚本。 模型架构: 作者描述的模型可以分为两个部分: 频谱图预测网络 声码器(例如Wavenet声码器) 要深入研究模型架构,训练过程和预处理逻辑,请参阅我们的 用法: 克隆存储库 $ git clone h
【文件预览】:
Tacotron-2-keras-master
----.gitignore(1KB)
----2_create_text_dataset.py(1KB)
----3_train.py(1KB)
----1_create_audio_dataset.py(3KB)
----model()
--------building_blocks.py(4KB)
--------tacotron_model.py(2KB)
----processing()
--------proc_audio.py(4KB)
--------proc_text.py(649B)
----LICENSE(1KB)
----hparams.py(768B)
----README.md(2KB)
----5_syntezer.py(0B)
----4_test.py(2KB)