【文件属性】:
文件名称:tacotron2:基于Tacotron 2和Waveglow的多扬声器和情感TTS
文件大小:1.02MB
文件格式:ZIP
更新时间:2021-05-16 01:23:15
nvidia tts emotions tacotron multispeaker
基于Tacotron 2和Waveglow的多扬声器和情感TTS
目录
运行TensorBoard
推理
参数
共享参数
共享的音频/ STFT参数
WaveGlow参数
Tacotron参数
贡献
一般说明
此存储库包含Tacotron 2,带有多扬声器,情感嵌入的WaveGlow的示例代码以及用于数据预处理的脚本。 检查点和代码来自以下来源:
英伟达深度学习实例
英伟达Tacotron 2
Nvidia WaveGlow
火炬轮毂WaveGlow
火炬轮毂Tacotron 2
完毕:
从上述5个来源中获取了所有最好的代码部分
清理代码并修复一些错误
更改代码结构
添加多说话者和情感参与者
添加预处理
将命令行args中的所有配置移到configs/experiments文件夹下的实验配置文件中
添加恢复/检查点机制
添加张量板
使解码器以每步n> 1帧
【文件预览】:
tacotron2-develop
----.gitignore(1KB)
----Dockerfile(328B)
----requirements.txt(75B)
----tacotron2()
--------text()
--------loss_function.py(2KB)
--------data_function.py(8KB)
--------model.py(27KB)
----LICENCE(1KB)
----README.md(14KB)
----configs()
--------experiments()
----multiproc.py(3KB)
----preprocess.py(9KB)
----router()
--------models.py(5KB)
--------loss_functions.py(2KB)
--------data_functions.py(4KB)
----common()
--------stft.py(6KB)
--------audio_processing.py(4KB)
--------layers.py(5KB)
--------utils.py(4KB)
----img()
--------tacotron-scalars.png(541KB)
--------tacotron-audio.png(488KB)
----inference.ipynb(154KB)
----waveglow()
--------loss_function.py(2KB)
--------data_function.py(4KB)
--------model.py(11KB)
----train.py(20KB)