FastSpeech:基于pytorch的FastSpeech的实现

时间:2024-02-25 16:44:26
【文件属性】:

文件名称:FastSpeech:基于pytorch的FastSpeech的实现

文件大小:6.36MB

文件格式:ZIP

更新时间:2024-02-25 16:44:26

deep-learning pytorch speech-synthesis DeeplearningPython

FastSpeech-Pytorch 基于Pytorch的FastSpeech的实现。 更新(2020/07/20) 优化培训过程。 优化长度调节器的实施。 使用与FastSpeech2相同的超级参数。 1、2和3的措施使训练过程比以前快3倍。 更好的语音质量。 模型 我的博客 准备数据集 下载并提取。 将LJSpeech数据集放入data 。 解压缩alignments.zip 。 将放入waveglow/pretrained_model ,并重命名为waveglow_256channels.pt ; 运行python3 preprocess.py 。 训练 运行pyth


【文件预览】:
FastSpeech-master
----glow.py(12KB)
----waveglow()
--------inference.py(3KB)
--------mel2samp.py(6KB)
--------__init__.py(51B)
--------convert_model.py(2KB)
----train.py(8KB)
----hparams.py(785B)
----text()
--------cmudict.py(2KB)
--------numbers.py(2KB)
--------__init__.py(2KB)
--------cleaners.py(2KB)
--------symbols.py(727B)
----img()
--------fastspeech_structure.png(398KB)
----utils.py(4KB)
----model.py(3KB)
----loss.py(751B)
----requirements.txt(83B)
----dataset.py(4KB)
----optimizer.py(1KB)
----modules.py(11KB)
----eval.py(3KB)
----README.md(2KB)
----sample()
--------135000_0_waveglow.wav(94KB)
--------135000_0.wav(186KB)
--------135000_2.wav(274KB)
--------135000_5_waveglow.wav(303KB)
--------135000_5.wav(604KB)
--------135000_1_waveglow.wav(140KB)
--------135000_3_waveglow.wav(309KB)
--------135000_4.wav(606KB)
--------135000_2_waveglow.wav(138KB)
--------135000_3.wav(615KB)
--------135000_4_waveglow.wav(304KB)
--------135000_1.wav(277KB)
----alignments.zip(3.97MB)
----data()
--------ljspeech.py(1KB)
----transformer()
--------Layers.py(7KB)
--------__init__.py(137B)
--------Modules.py(698B)
--------Constants.py(108B)
--------Models.py(5KB)
--------SubLayers.py(3KB)
----.gitignore(1KB)
----preprocess.py(797B)
----audio()
--------stft.py(6KB)
--------audio_processing.py(3KB)
--------__init__.py(94B)
--------tools.py(2KB)
--------hparams_audio.py(155B)

网友评论