文件名称:DeepSpeech:开源嵌入式语音到文本引擎-开源
文件大小:6.23MB
文件格式:ZIP
更新时间:2024-06-15 13:10:44
开源软件
DeepSpeech是一种开源嵌入式(离线,设备上)语音转文本引擎,可以在从Raspberry Pi 4到大功率GPU服务器的各种设备上实时运行。 DeepSpeech是一个开源语音转文本引擎,使用基于百度深度语音研究论文的机器学习技术训练的模型。 DeepSpeech项目使用Google的TensorFlow来简化实施过程。 可以使用预先训练的英语模型,可以按照用法文档中的说明进行下载。 如果要使用预先训练的英语模型来执行语音转文本,则可以从DeepSpeech发行页面下载它(以及其他重要的推理材料)。