cloning-voice:用于克隆声音下载

【文件属性】：

文件名称：cloning-voice:用于克隆声音

文件大小：2.27MB

文件格式：ZIP

更新时间：2024-05-06 12:57:38

Python

实时语音克隆该存储库是通过实时工作的声码器实现的（SV2TTS）的实现。如果您好奇或正在寻找我未记录的信息，请随时检查。通常，我建议您快速浏览一下引言之外的数字。 SV2TTS是一个三阶段的深度学习框架，它允许从几秒钟的音频中创建语音的数字表示，并使用它来调节经过训练的文本到语音模型，以推广到新的语音。视频演示（单击图片）：已实施文件网址指定标题实施源 SV2TTS 将学习从演讲者验证转移到多演讲者语音合成这个回购 WaveRNN（声码器）高效的神经音频合成 Tacotron 2（合成器）基于梅尔谱图预测的条件波网自然合成TTS GE2E（编码器）说话人验证的一般端到端损失这个回购消息 19/11/11 ：我现在全职工作，因此我将不再维护此仓库。对于阅读此内容的任何人：如果您只想克隆自己的声音，请在上检查我们的演示-它会比此回购提供更

立即下载

【文件预览】：
cloning-voice-main
----synthesizer()
--------inference.py(6KB)
--------train.py(21KB)
--------utils()
--------infolog.py(1KB)
--------models()
--------synthesize.py(4KB)
--------LICENSE.txt(1KB)
--------hparams.py(20KB)
--------feeder.py(11KB)
--------__init__.py(1B)
--------tacotron2.py(12KB)
--------audio.py(8KB)
--------preprocess.py(10KB)
----trump11.wav(1.55MB)
----.gitattributes(26B)
----utils()
--------profiler.py(1KB)
--------logmmse.py(9KB)
--------argutils.py(1KB)
----encoder_train.py(2KB)
----synthesizer_preprocess_audio.py(2KB)
----vocoder_train.py(3KB)
----demo_cli.py(9KB)
----demo_toolbox.py(2KB)
----synthesizer_train.py(3KB)
----requirements.txt(321B)
----README.md(5KB)
----vocoder()
--------inference.py(2KB)
--------train.py(4KB)
--------models()
--------LICENSE.txt(1KB)
--------hparams.py(2KB)
--------distribution.py(5KB)
--------display.py(3KB)
--------vocoder_dataset.py(3KB)
--------gen_wavernn.py(985B)
--------audio.py(2KB)
----toolbox()
--------utterance.py(222B)
--------__init__.py(10KB)
--------ui.py(20KB)
----demo_toolbox_collab.ipynb(1.3MB)
----encoder_preprocess.py(3KB)
----.gitignore(206B)
----vocoder_preprocess.py(2KB)
----encoder()
--------inference.py(8KB)
--------train.py(5KB)
--------config.py(1KB)
--------params_model.py(196B)
--------params_data.py(901B)
--------model.py(6KB)
--------visualizations.py(7KB)
--------data_objects()
--------audio.py(4KB)
--------preprocess.py(7KB)
----synthesizer_preprocess_embeds.py(1KB)

秒客网

cloning-voice:用于克隆声音

网友评论

相关文章