文件名称:onssen:开源语音分离和增强库
文件大小:50KB
文件格式:ZIP
更新时间:2024-03-13 01:26:48
Python
ONSSEN:开源语音分离和增强库 Onssen,发音为温泉,是一个基于PyTorch的库,用于语音分离,语音增强或语音样式转换。 发展计划: 提供用于数据,模型和评估的模板类 将模型移到单独的文件夹(即Kaldi样式) 重现分数并上传预训练的模型 在线分离的完成推断方法 2020-04-20更新: 添加深度聚类的评估方法 在深度聚类中使用W_ {MR}权重 小改动 支持机型 深度聚类 奇美拉网 嵌合体++ 相位估算网络 带有恢复层的语音增强 支持的数据集 Wsj0-2mix( ) 小睡( ) 爱丁堡-TTS( ) 要求 火炬 库罗莎 NumPy 用法 您可以简单地使用现有的配置JSON文件或自定义配置文件来训练增强或分离模型。 在egs / wsj0-2mix / deep_clustering /目录下: python run.py -c config.json
【文件预览】:
onssen-master
----egs()
--------wsj0-2mix()
--------edinburgh_tts()
--------daps()
----onssen()
--------loss()
--------utils()
--------evaluate()
--------__init__.py(98B)
--------nn()
--------data()
----LICENSE(34KB)
----README.md(2KB)
----.gitignore(6B)