文件名称:waveglow-vqvae:带有VQVAE的WaveGlow声码器
文件大小:3.6MB
文件格式:ZIP
更新时间:2024-04-04 02:43:09
JupyterNotebook
带有VQVAE的WaveGlow声码器 WaveGlow的Tensorflow实现和。 此实现包括多gpu和混合精度(尚不稳定)支持。 它高度基于github仓库: 。 此处使用的数据是和。 您可以在梅尔谱图或矢量量化表示形式中选择局部条件,还可以选择是否将说话人身份用作全局条件。 作为更多选项,实现了polyak平均,FiLM和权重归一化。 音频样本 LJ数据集 梅尔频谱图条件(原始WaveGlow): ://drive.google.com/open id 1HuV51fnhEZG_6vGubXVrer6lAtZK7py9 VQVAE条件: ://drive.google.com/open id 1xcGSelMycn2g-72noZH4vPiPpG0d7pZq VCTK语料库(语音转换) 它现在不能正常工作:( 来源(360): : 目标(303):
【文件预览】:
waveglow-vqvae-master
----.gitignore(64B)
----avg_checkpoints.py(5KB)
----hparams.py(3KB)
----em_toy.ipynb(2.34MB)
----Inference.ipynb(520KB)
----utils.py(2KB)
----commons.py(16KB)
----README.md(5KB)
----waveglow.py(20KB)
----generate_data.py(5KB)
----filelists()
--------ljs_audio_text_test_filelist.txt(70KB)
--------ljs_audio_text_eval_filelist.txt(14KB)
--------resample_vctk.py(2KB)
--------ljs_audio_text_train_filelist.txt(1.7MB)
--------vctk_sid_audio_text_eval_filelist.txt(9KB)
--------vctk_sid_audio_text_train_filelist.txt(3.69MB)
--------vctk_sid_audio_text_test_filelist.txt(43KB)
----decode.py(2KB)
----config.yml(1KB)
----data.py(4KB)
----train.py(1KB)