suzerospeech2019:斯泰伦博斯大学ZeroSpeech 2019系统

时间:2024-03-31 15:18:19
【文件属性】:

文件名称:suzerospeech2019:斯泰伦博斯大学ZeroSpeech 2019系统

文件大小:11.97MB

文件格式:ZIP

更新时间:2024-03-31 15:18:19

系统开源

斯泰伦博斯大学ZeroSpeech 2019系统 请注意:该代码目前处于非常初步的状态,即,开箱即用将很难使用。 我们希望对其进行清洁,并在不久的将来使它更可用。 概述 旨在回答如何直接从语音音频构建语音处理系统而无任何标签的问题。 它具有理解人类语言习得和为资源极低的语言开发技术的双重动机。 的任务是“没有T的TTS”,即没有文本输入的文本到语音。 这是suzerospeech (斯泰伦博斯大学ZeroSpeech 2019系统)的存储库。 免责声明 这里提供的代码不是很漂亮。 但是我们认为研究应该是可重复的。 我们对代码不提供任何保证,但是如果您有任何问题,发现错误或有任何一般性评论,请告诉我们。 储存库结构 码头工人/ 数据/-我们从挑战组织者获得或获得的任何数据文件。 功能/-在此处提取输入功能(MFCC,滤波器组等)。 wavenet /-WaveNet语音合成。 笔记本


【文件预览】:
suzerospeech2019-master
----docker()
--------Dockerfile.tf-py36.cpu(640B)
--------Dockerfile.torch-py36.gpu(797B)
--------Dockerfile.torch-py36.cpu(793B)
--------Dockerfile.tf-py36.gpu(642B)
----__run_docker_bash.sh(384B)
----notebooks()
--------binet.ipynb(38KB)
--------io_format.ipynb(77KB)
--------19_03_08_RPE_speech_compression_final.ipynb(8.81MB)
--------19_02_01_RPE_example_vq-vae_and_cat-vae.ipynb(9.66MB)
----src()
--------tf_base()
--------utils()
--------torch_base()
--------flags.py(780B)
--------__init__.py(0B)
----__run_docker_notebook.sh(774B)
----evaluation()
--------run_abx_eval.sh(3KB)
--------suzero_evaluate.sh(5KB)
--------run_abx_eval_remotely.sh(749B)
--------readme.md(3KB)
----samediff()
--------run_samediff.sh(2KB)
--------run_local.py(2KB)
--------run_calcdists.sh(2KB)
--------get_npz_keys.py(1KB)
--------readme.md(2KB)
--------create_labels.py(1KB)
----wavenet()
--------readme.md(0B)
----paths.py(151B)
----Makefile(30B)
----features()
--------audio_fftnet.py(3KB)
--------extract_zs2019_mfcc.py(3KB)
--------extract_buckeye_mfcc.py(5KB)
--------npz_to_binary.py(2KB)
--------segments_from_npz.py(3KB)
--------hknpz_to_text.py(5KB)
--------extract_zs2019_fbank.py(3KB)
--------utils.py(896B)
--------test_features.py(1KB)
--------merge_npz_clips.py(1KB)
--------get_mfccs.py(3KB)
--------samediff_words.py(3KB)
--------npz_remove_repetitions.py(1KB)
--------extract_zs2019_mfcc_fftnet.py(4KB)
--------extract_zs2019_fbank_fftnet.py(4KB)
--------extract_buckeye_fbank.py(5KB)
--------readme.md(2KB)
--------npz_to_zs2019_one_hot.py(1KB)
--------split_wav_vad.py(3KB)
--------features.py(4KB)
----conventional_tts()
--------baseline()
----FFTNet()
--------train.py(8KB)
--------generate.py(5KB)
--------hparams.py(1KB)
--------fftnet.py(3KB)
--------utils.py(2KB)
--------dataset.py(3KB)
----data()
--------buckeye_english.wrd(9.25MB)
--------buckeye_zs_speakers.list(48B)
--------buckeye_devpart2_speakers.list(32B)
----.gitignore(121B)
----readme.md(4KB)

网友评论