文件名称:end2end-asr-pytorch:PyTorch上的端到端自动语音识别
文件大小:106KB
文件格式:ZIP
更新时间:2024-06-18 06:53:32
end-to-end speech pytorch transformer speech-recognition
Pytorch 上的端到端语音识别 基于 Transformer 的语音识别模型 如果您在工作中使用了本工具包中包含的任何源代码,请引用以下论文。 Winata,GI,Madotto,A.,Wu,CS,&Fung,P.(2019年)。 使用来自并行句子的基于神经的合成数据的代码切换语言模型。 在第23届计算自然语言学习会议(CoNLL)的会议记录中(第271-280页)。 Winata, GI, Cahyawijaya, S., Lin, Z., Liu, Z., & Fung, P. (2019)。 使用 Low-Rank Transformer 的轻量级和高效的端到端语音识别。 arXiv 预印本 arXiv:1910.13923。 (被ICASSP 2020接受) Zhou, S., Dong, L., Xu, S., & Xu, B. (2018)。 使用 Transfor
【文件预览】:
end2end-asr-pytorch-master
----train.py(4KB)
----utils()
--------functions.py(6KB)
--------awd_lstm_utils.py(9KB)
--------lm_data_loader.py(2KB)
--------__init__.py(0B)
--------optimizer.py(2KB)
--------constant.py(6KB)
--------metrics.py(6KB)
--------lstm_utils.py(7KB)
--------audio.py(2KB)
--------logger.py(594B)
--------lm_functions.py(4KB)
--------data_loader.py(9KB)
----requirement.sh(49B)
----models()
--------__init__.py(0B)
--------common_layers.py(10KB)
--------asr()
----test.py(4KB)
----img()
--------aishell_loss.jpg(32KB)
--------pytorch-logo-dark.png(15KB)
----LICENSE(1KB)
----trainer()
--------__init__.py(0B)
--------asr()
----README.md(5KB)
----data()
--------librispeech.py(5KB)
--------helper.py(14KB)
--------labels()
--------utils.py(5KB)
--------aishell.py(16KB)
----.gitignore(1KB)