FastSpeech2:FastSpeech 2的PyTorch实现

时间:2021-05-22 17:57:06
【文件属性】:
文件名称:FastSpeech2:FastSpeech 2的PyTorch实现
文件大小:6.07MB
文件格式:ZIP
更新时间:2021-05-22 17:57:06
text-to-speech pytorch tts tts-engines fastspeech Fastspeech 2 FastSpeech 非官方PyTorch实现。 此仓库以的FastSpeech实现为基础。 在此实现中,我尝试复制确切的纸张详细信息,但仍需要进行一些修改才能获得更好的模型,此存储库可提供任何建议和改进。 此存储库使用Nvidia的tacotron 2预处理进行音频预处理,并使用作为声码器。 演示: 要求 : 用Python 3.6.2编写的所有代码。 安装Pytorch 在安装pytorch之前,请通过运行以下命令检查您的Cuda版本: nvcc --version pip install torch torchvision 在此仓库中,我将Pytorch 1.6.0用于torch.bucketize功能,该功能在以前的PyTorch版本中不存在。 安装其他要求: pip install -r requirements.txt 要使用Tens
【文件预览】:
FastSpeech2-master
----core()
--------duration_modeling()
--------encoder.py(8KB)
--------variance_predictor.py(10KB)
--------attention.py(3KB)
--------__init__.py(0B)
--------modules.py(11KB)
--------embedding.py(4KB)
--------optimizer.py(2KB)
----train_fastspeech.py(16KB)
----demo_fastspeech2.ipynb(997KB)
----inference.py(7KB)
----.github()
--------workflows()
----sample()
--------sample_74k_melgan.wav(324KB)
--------sample_102k_waveglow.wav(215KB)
--------sample_58k.wav(212KB)
--------sample_102k_melgan.wav(215KB)
--------sample_74k_waveglow.wav(324KB)
--------sample2_58k.wav(360KB)
--------generated_mel_58k.npy(132KB)
----assets()
--------tensorboard1.png(125KB)
--------tensorboard2_1.png(108KB)
--------tensorboard1_1.png(89KB)
--------model.txt(11KB)
--------tensorboard2.png(146KB)
--------fastspeech2.png(160KB)
----export_torchscript.py(2KB)
----evaluation.py(3KB)
----tests()
--------test_fastspeech2.py(651B)
--------__init__.py(0B)
----LICENSE(11KB)
----nvidia_preprocessing.py(2KB)
----dataset()
--------texts()
--------audio_processing.py(6KB)
--------dataloader.py(5KB)
--------__init__.py(0B)
--------ljspeech.py(2KB)
----fastspeech.py(15KB)
----compute_statistics.py(3KB)
----configs()
--------default.yaml(4KB)
----requirements.txt(156B)
----filelists()
--------train_filelist.txt(9.47MB)
--------valid_filelist.txt(8KB)
----.gitignore(360B)
----README.md(4KB)
----utils()
--------display.py(2KB)
--------stft.py(8KB)
--------fastspeech2_script.py(9KB)
--------util.py(17KB)
--------__init__.py(0B)
--------hparams.py(2KB)
--------plot.py(3KB)

网友评论