python实现百度语音识别api

时间:2022-08-24 10:39:44

本文实例为大家分享了python实现百度语音识别的具体代码,供大家参考,具体内容如下

详细百度语音识别api文档

先下载python用SDK,可以用python setup.py install安装

?
1
2
3
4
5
6
7
8
9
10
# 引入Speech SDK
from aip import AipSpeech
 
# 定义常量
APP_ID = '你的 App ID'
API_KEY = '你的 API Key'
SECRET_KEY = '你的 Secret Key'
 
# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。

开始识别

注意:

请求说明:
1. 原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
2. 压缩格式支持:pcm(不压缩)、wav、amr
3. 系统支持语言种类:中文(zh)、粤语(ct)、英文(en)。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 读取文件
def get_file_content(filePath):
 with open(filePath, 'rb') as fp:
 return fp.read()
 
# 识别本地文件
aipSpeech.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
 'lan': 'zh',
})
 
# 从URL获取文件识别
aipSpeech.asr('', 'pcm', 16000, {
 'url': 'http://121.40.195.233/res/16k_test.pcm',
 'callback': 'http://xxx.com/receive',
})

返回结果:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
// 成功返回
{
 "err_no": 0,
 "err_msg": "success.",
 "corpus_no": "15984125203285346378",
 "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
 "result": ["北京天气"]
}
 
// 失败返回
{
 "err_no": 2000,
 "err_msg": "data empty.",
 "sn": null
}

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。

原文链接:https://blog.csdn.net/qq_35037977/article/details/76274157