文件名称:voicefilter:Google AI的VoiceFilter系统的非官方PyTorch实施
文件大小:1.15MB
文件格式:ZIP
更新时间:2024-03-31 13:33:10
系统开源
语音过滤器 承元的说明(2020.10.25) 嗨,大家好! 我是MINDs Lab,Inc.的Seung-won。自从我发布此开源文件已经很长时间了,而且我没想到这个存储库会在很长一段时间内引起如此大的关注。 我要感谢大家的关注,同时也要感谢Quanquan Wang先生(VoiceFilter论文的第一作者)在他的论文中提到这个项目。 实际上,这个项目是我在没有相关领域主管的情况下开始研究深度学习和语音分离的仅仅三个月后才由我完成的。 那时,我不知道什么是幂律压缩,以及验证/测试模型的正确方法。 从那时起,我花了更多时间在深度学习和语音上(我还写了一篇论文,发表在 :smiling_face_with_smiling_eyes: ),我可以观察到一些明显的错误。 那些问题是由GitHub用户提出的; 请参阅和。 话虽这么说,该存储库可能非常不可靠,我想提醒所有人,使用此代码需要您自担风险(如LICENSE中所述)。 不幸的是,我没有足够的
【文件预览】:
voicefilter-master
----inference.py(2KB)
----utils()
--------train.py(4KB)
--------normalize-resample.sh(583B)
--------evaluation.py(1KB)
--------hparams.py(2KB)
--------writer.py(2KB)
--------plotting.py(643B)
--------adabound.py(6KB)
--------audio.py(2KB)
----model()
--------model.py(3KB)
--------embedder.py(1KB)
----requirements.txt(79B)
----datasets()
--------dataloader.py(4KB)
----generator.py(6KB)
----config()
--------default.yaml(887B)
----assets()
--------target.wav(94KB)
--------ref-voice.wav(145KB)
--------tensorboard.png(686KB)
--------voicefilter.png(105KB)
--------mixed.wav(94KB)
--------sdr-result.png(45KB)
--------estimated.wav(94KB)
----README.md(8KB)
----.gitignore(1KB)
----trainer.py(2KB)