文件名称:dctts-pytorch:DC-TTS的pytorch实现
文件大小:2.57MB
文件格式:ZIP
更新时间:2024-05-31 17:02:27
text-to-speech pytorch tts dc-tts Python
DC-TTS 的papar的pytorch实现。 感谢 ,它为我克服了一些困难提供了很多帮助。 数据集 。 一个公共领域的语音数据集,由一个女性发言人的13,100个简短音频片段组成。 火车 我已经调整了超参数,并使用LJ语音数据集训练了模型。 超级参数可能不是最好的,并且与原始纸张中使用的那些参数略有不同。 要使用LJ语音数据集自己训练模型,请执行以下操作: 下载数据集并解压缩到目录中,在pkg/hyper.py设置目录 运行预处理 python3 main.py --action preprocess 训练Text2Mel网络,您可以将设备更改为以pkg/hyper.py训练pkg/hyper.py python3 main.py --action train --module Text2Mel 训练SSRN网络,也可以更改训练设备 python3 main.py --a
【文件预览】:
dctts-pytorch-master
----.gitignore(34B)
----pkg()
--------networks.py(11KB)
--------train.py(11KB)
--------utils.py(11KB)
--------__init__.py(0B)
--------modules()
--------synthesis.py(2KB)
--------preprocess.py(2KB)
--------hyper.py(1KB)
--------data.py(5KB)
----sentences.txt(380B)
----LICENSE(1KB)
----main.py(1KB)
----readme.md(3KB)
----synthesis()
--------syn_5.wav(912KB)
--------atten_0.png(16KB)
--------mels_0.png(21KB)
--------mags_2.png(23KB)
--------mags_5.png(56KB)
--------syn_2.wav(164KB)
--------mels_5.png(50KB)
--------atten_2.png(16KB)
--------mags_4.png(52KB)
--------mels_1.png(24KB)
--------mags_3.png(18KB)
--------mags_0.png(22KB)
--------atten_5.png(21KB)
--------syn_0.wav(158KB)
--------atten_1.png(16KB)
--------mels_2.png(22KB)
--------atten_4.png(20KB)
--------atten_3.png(16KB)
--------syn_1.wav(228KB)
--------mels_3.png(19KB)
--------mags_1.png(26KB)
--------syn_3.wav(102KB)
--------syn_4.wav(726KB)
--------mels_4.png(45KB)
----.idea()
--------workspace.xml(26KB)
--------vcs.xml(180B)
--------modules.xml(268B)
--------yuki_tts.iml(499B)