spoken-digit-recognition:LLSTM语音数字识别下载

【文件属性】：

文件名称：spoken-digit-recognition:LLSTM语音数字识别

文件大小：19.29MB

文件格式：ZIP

更新时间：2024-05-18 18:08:26

recurrent-neural-networks mnist speech-recognition lstm-model digit-recognition

口语数字识别 :studio_microphone: LSTM语音数字识别内容概述语音数字识别是一个隔离的单词识别系统，可转录0-9之间的各个语音号码。数据集使用免费语音数字数据集（FSDD）来训练该模型，该模型具有来自3位讲英语且带有重音的扬声器的1,500张录音。该模型接受了1,470张唱片的训练，并在30张唱片上进行了测试。模型与训练该模型包括： LSTM层全连接层损失函数：分类交叉熵优化算法：亚当模型在300个时代进行了训练。改进和要添加的功能数据集需要更多不同类型的发言人，包括不同性别和不同口音的人，以便该系统在世界范围内正常运行模型本身可以改进使用更好的培训/测试策略具有使用自己的声音来测试模型的界面，使前端易于与模型进行交互改善模型性能基本上，这是我的实验，旨在了解如何构建仅检测语音数字的语音识别系统。用法 python spoke_digit.py为了运行

立即下载

秒客网

spoken-digit-recognition:LLSTM语音数字识别

网友评论

相关文章