在5秒钟内克隆语音以实时生成任意语音-Python开发

时间:2024-06-13 11:10:08
【文件属性】:

文件名称:在5秒钟内克隆语音以实时生成任意语音-Python开发

文件大小:200KB

文件格式:ZIP

更新时间:2024-06-13 11:10:08

Python Natural Language Processing

在5秒钟内克隆语音以实时生成任意语音实时语音克隆此存储库是从语音验证到语音识别的多人语音合成语音学习(SV2TTS)的转移学习的一种实现,该声码器可以实时工作。 如果您好奇或正在寻找我未记录的信息,请随时检查我的论文。 通常,我建议您快速浏览一下引言之外的数字。 SV2TTS是一个三阶段的深度学习框架,允许从少数几个创建语音的数字表示


【文件预览】:
Real-Time-Voice-Cloning-master
----encoder()
--------__init__.py(0B)
--------inference.py(8KB)
--------config.py(1KB)
--------params_data.py(901B)
--------data_objects()
--------visualizations.py(7KB)
--------preprocess.py(7KB)
--------params_model.py(196B)
--------audio.py(5KB)
--------model.py(6KB)
--------train.py(5KB)
----.gitignore(206B)
----demo_cli.py(11KB)
----requirements.txt(262B)
----synthesizer_preprocess_audio.py(3KB)
----vocoder()
--------models()
--------hparams.py(2KB)
--------inference.py(2KB)
--------distribution.py(5KB)
--------LICENSE.txt(1KB)
--------audio.py(2KB)
--------display.py(3KB)
--------gen_wavernn.py(985B)
--------vocoder_dataset.py(3KB)
--------train.py(5KB)
----samples()
--------1320_00000.mp3(15KB)
--------README.md(943B)
--------p240_00000.mp3(20KB)
--------VCTK.txt(5KB)
--------8230_00000.mp3(16KB)
--------6829_00000.mp3(15KB)
--------p260_00000.mp3(20KB)
--------3575_00000.mp3(15KB)
----demo_toolbox.py(2KB)
----LICENSE.txt(1KB)
----utils()
--------modelutils.py(886B)
--------__init__.py(0B)
--------profiler.py(1KB)
--------logmmse.py(9KB)
--------argutils.py(1KB)
----synthesizer_train.py(2KB)
----encoder_train.py(2KB)
----README.md(5KB)
----vocoder_train.py(3KB)
----synthesizer_preprocess_embeds.py(1KB)
----encoder_preprocess.py(3KB)
----synthesizer()
--------__init__.py(1B)
--------models()
--------hparams.py(5KB)
--------inference.py(7KB)
--------synthesize.py(4KB)
--------LICENSE.txt(1KB)
--------utils()
--------preprocess.py(12KB)
--------audio.py(8KB)
--------synthesizer_dataset.py(3KB)
--------train.py(11KB)
----toolbox()
--------utterance.py(222B)
--------__init__.py(14KB)
--------ui.py(24KB)
----vocoder_preprocess.py(3KB)
----.gitattributes(26B)

网友评论