Athena - 端到端自动语音识别(ASR)引擎的开源实现-python

时间:2024-07-08 14:54:11
【文件属性】:

文件名称:Athena - 端到端自动语音识别(ASR)引擎的开源实现-python

文件大小:874KB

文件格式:ZIP

更新时间:2024-07-08 14:54:11

机器学习

Athena - 端到端自动语音识别(ASR)引擎的开源实现 Athena Athena 是端到端自动语音识别 (ASR) 引擎的开源实现。 目前该项目支持基于连接主义时间分类 (CTC) 的模型、基于转换器的编码器-解码器模型和基于混合 CTC/注意力的模型以及无监督预训练的训练和解码。 我们的愿景是为语音识别的端到端模型的工业应用和学术研究提供支持。 为了让每个人都可以使用 ASR,我们还发布了一些基于一些开源数据集的示例实现,例如 HKSUT、Librispeech 我们所有的模型都是在 Tensorflow>=2.0.0 中实现的。 1) 目录 Athena 1) 目录 2) 主要功能 3) 安装 3.1) 创建虚拟环境 [可选] 3.2) 安装 tensorflow 后端 3.3) 安装 horovod 进行多设备训练 [可选] 3.4) 安装 athena 包 3.5 ) 测试您的安装注意事项 4) 数据准备 4.1) 创建清单 5) 训练 5.1) 设置配置文件 5.2) 训练模型 6) 结果 7) 目录结构 2) 关键特性 基于混合 CTC/Transfo


网友评论