文件名称:VC-with-GAN:GAN的语音转换
文件大小:8.56MB
文件格式:ZIP
更新时间:2024-05-28 08:47:24
tensorflow voice gan voice-conversion voice-synthesis
带有VC的 CS 753 ASR项目 使用步骤: 运行bash download.sh以准备VCC2018数据集。 运行analyzer.py提取特征并将特征写入二进制文件。 (这需要几分钟。) 运行build.py记录一些统计信息,例如光谱极值和音调。 例如,要训练VAWGAN,请运行 python main.py \ --model VAWGAN \ --trainer VAWGANTrainer \ --architecture architecture-vawgan-vcc2016.json 您可以在./logdir/train/[timestamp]找到您的模型 要转换声音,请运行 python convert.py \ --src VCC2SF1 \ --trg VCC2TM1 \ --model VAWGAN \ --checkpoint logdir/train/
【文件预览】:
VC-with-GAN-master
----i_vec_dict.pkl(5KB)
----architecture-vawgan-vcc2016.json(948B)
----Reference()
--------Auto_encoding_variational_bayes.pdf(3.74MB)
--------VC_from_unaligned_corpora_using_vawgan.pdf(905KB)
--------VC_from_non_parallel_corpora_using_vae.pdf(448KB)
--------Modeling_and_transforming_speech_using_vae.pdf(2.67MB)
----images()
--------VAE_network.png(15KB)
--------VAWGAN_network.png(22KB)
----model()
--------vae.py(31KB)
--------vawgan.py(6KB)
----i_vec_parse.py(440B)
----main.py(4KB)
----phone_embedding.py(1KB)
----etc()
--------TM1.npf(8B)
--------VCC2TM2.npf(8B)
--------VCC2SM1.npf(8B)
--------VCC2TF1.npf(8B)
--------VCC2SF1.npf(8B)
--------VCC2TM1.npf(8B)
--------TM3.npf(8B)
--------SF3.npf(8B)
--------VCC2SF2.npf(8B)
--------SF2.npf(8B)
--------VCC2SM4.npf(8B)
--------VCC2SM2.npf(8B)
--------VCC2SM3.npf(8B)
--------VCC2SF3.npf(8B)
--------speakers.tsv(96B)
--------xmax.npf(4KB)
--------xmin.npf(4KB)
--------TF1.npf(8B)
--------TM2.npf(8B)
--------SM3.npf(8B)
--------TF2.npf(8B)
--------VCC2TF2.npf(8B)
--------SM1.npf(8B)
--------SF1.npf(8B)
--------VCC2SF4.npf(8B)
----convert_all.sh(2KB)
----analyzer.py(11KB)
----sentence_embedding.py(5KB)
----Report()
--------report.aux(604B)
--------aaai.sty(13KB)
--------images()
--------fixbib.sty(5KB)
--------report.log(17KB)
--------ref.bib(2KB)
--------report.pdf(527KB)
--------aaai.bst(21KB)
--------report.tex(18KB)
----Work_progress()
--------ToDo.txt(122B)
----util()
--------wrapper.py(4KB)
--------LICENSE(1KB)
--------mnist.py(2KB)
--------README.md(49B)
--------layers.py(7KB)
--------io.py(1KB)
--------image.py(2KB)
----convert.py(5KB)
----environment.yml(160B)
----trainer()
--------gan.py(17KB)
--------vae.py(19KB)
----download.sh(622B)
----README.md(3KB)
----data()
--------i_vec_dict.pkl(5KB)
----architecture-vawgan-ivector.json(987B)
----architecture-vawgan-sent.json(1KB)
----DeepSpeech.py(81KB)
----architecture-vae-vcc2016.json(676B)
----build.py(3KB)