Speech-Transformer:PyTorch语音转换器的重新实现

时间:2024-06-05 03:15:09
【文件属性】:

文件名称:Speech-Transformer:PyTorch语音转换器的重新实现

文件大小:1.03MB

文件格式:ZIP

更新时间:2024-06-05 03:15:09

Python

语音变压器 介绍 这是语音变压器的PyTorch重新实现:用于语音识别的无重复序列到序列模型。 数据集 Aishell是由北京壳牌壳牌科技有限公司发行的开源中文普通话语料库。 邀请了来自中国不同口音地区的400人参加录音,该录音是在安静的室内环境中使用高保真麦克风进行的,并下采样至16kHz。 通过专业的语音注释和严格的质量检查,手册的转录准确性达到95%以上。 数据免费供学术使用。 我们希望为语音识别领域的新研究人员提供适度的数据。 @inproceedings{aishell_2017, title={AIShell-1: An Open-Source Mandarin Speech Corpus and A Speech Recognition Baseline}, author={Hui Bu, Jiayu Du, Xingyu Na, Bengu Wu, Hao Z


【文件预览】:
Speech-Transformer-master
----.gitignore(76B)
----data_gen.py(5KB)
----requirements.txt(7B)
----sponsor.jpg(41KB)
----README.t(4KB)
----audios()
--------audio_9.wav(124KB)
--------audio_6.wav(102KB)
--------audio_7.wav(110KB)
--------audio_1.wav(100KB)
--------audio_5.wav(107KB)
--------audio_4.wav(128KB)
--------audio_2.wav(115KB)
--------audio_8.wav(217KB)
--------audio_0.wav(130KB)
--------audio_3.wav(159KB)
----LICENSE(1KB)
----ngram_lm.py(1KB)
----utils.py(9KB)
----pre_process.py(3KB)
----README.md(6KB)
----test_lm.py(1KB)
----results.json(4KB)
----config.py(980B)
----test.py(2KB)
----demo.py(3KB)
----collect_char_list.py(264B)
----replace.py(729B)
----extract.py(295B)
----export.py(236B)
----char_list.pkl(67KB)
----xer.py(2KB)
----test()
--------test_decode.py(2KB)
--------test_pe.py(1KB)
--------test_lm.py(639B)
--------test_specaug.py(802B)
--------test_trim.py(713B)
--------test_lr.py(438B)
----transformer()
--------__init__.py(0B)
--------utils.py(4KB)
--------module.py(2KB)
--------attention.py(3KB)
--------loss.py(2KB)
--------optimizer.py(887B)
--------decoder.py(10KB)
--------transformer.py(2KB)
--------encoder.py(3KB)
----specAugment()
--------sparse_image_warp_pytorch.py(16KB)
--------__init__.py(0B)
--------spec_augment_pytorch.py(5KB)
--------spec_augment_tensorflow.py(8KB)
--------sparse_image_warp_np.py(7KB)
----train.py(6KB)

网友评论