文件名称:Real-Time-Voice-Cloning:多扬声器TTS,
文件大小:144KB
文件格式:ZIP
更新时间:2024-03-30 08:13:37
Python
与 添加中文数据集用于扬声器编码器和合成器训练( , , 等) 修复错误,加快扬声器编码器的培训速度(GPU上的位置丢失)。 欢迎使用中文提问 实时语音克隆 该存储库是通过实时工作的声码器实现的(SV2TTS)的实现。 如果您好奇或正在寻找我尚未记录的信息,请随时检查(不要犹豫,为此也要提出问题)。 通常,我建议您快速浏览一下引言之外的数字。 SV2TTS是一个三阶段的深度学习框架,它允许从几秒钟的音频中创建语音的数字表示,并使用它来调节经过训练的文本到语音模型,以推广到新的语音。 视频演示(单击图片): 已实施文件 网址 指定 标题 实施源 SV2TTS 将学习从演讲者验证转移到多演讲者语音合成 这个回购 WaveRNN(声码器) 高效的神经音频合成 Tacotron 2(合成器) 基于梅尔谱图预测的条件波网自然合成TTS GE2E(编码器) 说话人验证的一般端
【文件预览】:
Real-Time-Voice-Cloning-master
----save_place.py(406B)
----vocoder_train.py(3KB)
----encoder_preprocess.py(3KB)
----synthesizer_train.py(3KB)
----synthesizer_preprocess_embeds.py(1KB)
----synthesizer_preprocess_audio.py(3KB)
----ge2e_api.py(2KB)
----encoder_train.py(2KB)
----synthesizer()
--------feeder.py(13KB)
--------models()
--------synthesize.py(3KB)
--------audio.py(8KB)
--------inference.py(6KB)
--------train.py(21KB)
--------textnorm()
--------__init__.py(1B)
--------preprocess.py(22KB)
--------infolog.py(1KB)
--------hparams.py(20KB)
--------utils()
--------tacotron2.py(12KB)
--------LICENSE.txt(1KB)
----run_chinese.sh(2KB)
----requirements.txt(180B)
----run_english.sh(3KB)
----.gitignore(305B)
----overall_eval_us.py(7KB)
----vocoder_preprocess.py(2KB)
----toP40.sh(1KB)
----vocoder()
--------models()
--------distribution.py(5KB)
--------display.py(3KB)
--------gen_wavernn.py(985B)
--------audio.py(2KB)
--------inference.py(2KB)
--------vocoder_dataset.py(3KB)
--------train.py(4KB)
--------hparams.py(2KB)
--------LICENSE.txt(1KB)
----README.md(5KB)
----overall_eval_zh.py(7KB)
----utils()
--------mesc.py(407B)
--------logmmse.py(9KB)
--------profiler.py(1KB)
--------__init__.py(0B)
--------argutils.py(1KB)
----.editorconfig(147B)
----encoder()
--------audio.py(6KB)
--------inference.py(8KB)
--------train.py(7KB)
--------visualizations.py(7KB)
--------params_model.py(220B)
--------__init__.py(0B)
--------preprocess.py(10KB)
--------params_data.py(900B)
--------model.py(6KB)
--------config.py(1KB)
--------data_objects()
----LICENSE.txt(1KB)