SpecAugment:由Tensorflow和Pytorch实现的SpecAugment,由Google Brain介绍

时间:2024-02-27 02:34:01
【文件属性】:

文件名称:SpecAugment:由Tensorflow和Pytorch实现的SpecAugment,由Google Brain介绍

文件大小:237KB

文件格式:ZIP

更新时间:2024-02-27 02:34:01

python tensorflow speech pytorch speech-recognition

规格 这是SpecAugment的一种实现,该语音数据增强方法可直接使用Tensorflow&Pytorch处理频谱图,这是Google Brain提出的[1]。 当前在Apache 2.0中使用,请随时用于您的项目。 请享用! 如何使用 首先,您需要与一起安装python 3。 接下来,您需要安装一些音频库才能正常工作。 安装需求包。 运行以下命令: pip3 install SpecAugment 然后,运行specAugment.py程序。 它通过在时间方向上扭曲频谱图,掩盖连续频道的块以及掩盖时间上的话语来修改频谱图。 尝试您的音频文件SpecAugment $ python


【文件预览】:
SpecAugment-master
----images()
--------Figure_1.png(78KB)
--------Figure_2.png(66KB)
----requirements.txt(24B)
----SpecAugment()
--------sparse_image_warp_np.py(7KB)
--------__init__.py(0B)
--------sparse_image_warp_pytorch.py(16KB)
--------spec_augment_pytorch.py(5KB)
--------spec_augment_tensorflow.py(8KB)
----LICENSE(11KB)
----setup.cfg(39B)
----setup.py(388B)
----README.md(3KB)
----data()
--------61-70968-0002.wav(93KB)
----tests()
--------spec_augment_test_TF.py(3KB)
--------spec_augment_test_pytorch.py(3KB)
----.gitignore(20B)

网友评论