文件名称:GST-tacotron:复制样式令牌
文件大小:1.23MB
文件格式:ZIP
更新时间:2024-05-19 08:46:19
speech-synthesis tacotron global-style-tokens gst-tacotron Python
消费税 再现:样式标记:端到端语音合成中的无监督样式建模,控制和传输( ) Python和工具包版本 Python: '3.5.2' numpy: '1.13.1' tensorflow: '1.4' 样本和预训练模型 在可以找到样本,进行了两种实验: 参考音频条件: BZ_440K.wav是在Blizzard2013上训练的模型的推理结果,为440K步长(batch_size = 16),调节的参考音频是从其测试集中选取的。 LJ_448K.wav是在LJ_Speech上训练的模型的另一个推论结果,为448K步长(batch_size = 16),调节的参考音频也从其测试集中选取。 消费税的组合: normal.wav和slow.wav是在LJ_Speech上训练的模型的两个推断结果,两者之间的区别是通过选择不同的样式标记进行样式嵌入。 high.w
【文件预览】:
GST-tacotron-master
----train.py(2KB)
----hyperparams.py(2KB)
----utils.py(4KB)
----infer.py(3KB)
----modules.py(11KB)
----eval.py(2KB)
----samples()
--------LJ_448K.wav(412KB)
--------high.wav(124KB)
--------low.wav(133KB)
--------normal.wav(254KB)
--------slow.wav(392KB)
--------BZ_440K.wav(103KB)
----README.md(4KB)
----network.py(7KB)
----load_tfrecords.py(3KB)
----graph.py(7KB)
----.gitignore(49B)
----make_tfrecords.py(4KB)