文件名称:spec_augment:Google GoogleBrain的SpecAugment的Pytorch实现
文件大小:7.89MB
文件格式:ZIP
更新时间:2024-06-11 16:13:47
JupyterNotebook
派托(Pytorch)规格 Pytorch实现GoogleBrain的SpecAugment:一种用于自动语音识别的简单数据增强方法 是用于语音识别的最先进的数据增强方法。 该论文的作者没有发布我可以找到的代码,并且它们的实现是在TensorFlow中进行的。 我们使用Pytorch,torchaudio和 / 实现了所有三个SpecAugment转换。 使用方法: 运行install.sh (我建议为项目使用唯一的conda env) 安装脚本运行后,您的项目文件夹中应该有一个torchaudio文件夹。 请查看SpecAugment.ipynb(Jupyter笔记本)以获取功能。 增强 时间扭曲 时光面具 频率模板 合并: 关于时间扭曲的注意事项 时间扭曲增强依赖于Pytorch不支持的Tensorflow特定功能。 我们在SparseImageWarp.ipynb实现了
【文件预览】:
spec_augment-master
----.gitignore(30B)
----SparseImageWarp.ipynb(22KB)
----README.md(2KB)
----exp()
--------__pycache__()
--------nb_SparseImageWarp.py(15KB)
----SpecAugment.ipynb(2.22MB)
----LICENSE(1KB)
----install.sh(161B)
----img()
--------combined.png(577KB)
--------freqmask.png(1.71MB)
--------timewarp.png(1.25MB)
--------timemask.png(1.92MB)
----party-crowd.wav(859KB)
----notebook2script.py(1KB)