文件名称:voice100-tts
文件大小:542KB
文件格式:ZIP
更新时间:2024-05-02 01:38:47
Python
语音100 目标 不要依赖非商业许可的数据集 足够小,可以在普通PC,Raspberry Pi或智能手机上运行。 样品合成 如何训练 前处理 获取CSS10日语语料库,并提取./data下的数据。 ./data/japanese-single-speaker-speech-dataset/transcript.txt应该是笔录数据的路径。 运行预处理, $ python -m voice100.preprocess --dataset css10ja 这将生成data/css10ja_train.npz和data/css10ja_val.npz 训练高度模型 对齐模型将数据集的文本和音频对齐。 $ python -m voice100.train_ctc --mode train --dataset css10ja --model_dir model/ctc 估计高度 这使得d
【文件预览】:
voice100-tts-main
----docs()
--------train_loss_audio.png(13KB)
--------train_loss_align.png(20KB)
--------train_ctc.png(37KB)
--------sample2.wav(313KB)
--------sample1.wav(245KB)
----LICENSE(1KB)
----setup.py(834B)
----.gitignore(2KB)
----README.md(3KB)
----voice100_tts()
--------encoder.py(651B)
--------_yomi2voca.py(7KB)
--------_text2voca.py(2KB)
--------data_pipeline_test.py(3KB)
--------train.py(13KB)
--------preprocess_test.py(2KB)
--------train_ctc.py(11KB)
--------__init__.py(0B)
--------preprocess.py(11KB)
--------transformer.py(12KB)
--------vocoder.py(3KB)
--------data_pipeline.py(7KB)
--------data.py(3KB)
----.vscode()
--------settings.json(125B)