lasr:自动语音识别的PyTorch Lightning实现

时间:2024-05-06 05:33:55
【文件属性】:

文件名称:lasr:自动语音识别的PyTorch Lightning实现

文件大小:52KB

文件格式:ZIP

更新时间:2024-05-06 05:33:55

speech-recognition asr conformer pytorch-lightning Python

激光 闪电自动语音识别 一个基于PyTorch-Lightning的MIT许可ASR研究库,用于开发端到端ASR模型。 介绍 是用于高性能AI研究的轻量级包装器。 PyTorch非常易于使用,可以构建复杂的AI模型。 但是一旦研究变得复杂,并且诸如多GPU训练,16位精度和TPU训练之类的东西混在一起,用户很可能会引入错误。 PyTorch Lightning恰好解决了这个问题。 Lightning构造了您的PyTorch代码,因此它可以抽象出培训的详细信息。 这使AI研究具有可扩展性,并且可以快速迭代。 该项目是使用PyTorch Lightning实现asr项目的示例。 在这个项目中,我训练了一个模型,该模型包括一个带有联合CTC注意的构象编码器+ LSTM解码器。 所述LASR装置升ighthning一个utomatic小号peechřecognition。 我希望这可以成为那些研究


【文件预览】:
lasr-main
----setup.py(2KB)
----.gitignore(2KB)
----dataset()
--------prepare_libri.py(2KB)
--------preprocess.py(3KB)
--------prepare-libri.sh(2KB)
----bin()
--------main.py(4KB)
----LICENSE(1KB)
----README.md(6KB)
----configs()
--------data()
--------recognizer()
--------train.yaml(72B)
--------trainer()
----lasr()
--------data()
--------model()
--------vocabs()
--------optim()
--------criterioin()
--------metric.py(3KB)

网友评论