本文实例为大家分享了python实现百度语音识别的具体代码,供大家参考,具体内容如下
先下载python用SDK,可以用python setup.py install安装
1
2
3
4
5
6
7
8
9
10
|
# 引入Speech SDK
from aip import AipSpeech
# 定义常量
APP_ID = '你的 App ID'
API_KEY = '你的 API Key'
SECRET_KEY = '你的 Secret Key'
# 初始化AipSpeech对象
aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
|
在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。
开始识别
注意:
请求说明:
1. 原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
2. 压缩格式支持:pcm(不压缩)、wav、amr
3. 系统支持语言种类:中文(zh)、粤语(ct)、英文(en)。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
# 读取文件
def get_file_content(filePath):
with open (filePath, 'rb' ) as fp:
return fp.read()
# 识别本地文件
aipSpeech.asr(get_file_content( 'audio.pcm' ), 'pcm' , 16000 , {
'lan' : 'zh' ,
})
# 从URL获取文件识别
aipSpeech.asr(' ', ' pcm', 16000 , {
'url' : 'http://121.40.195.233/res/16k_test.pcm' ,
'callback' : 'http://xxx.com/receive' ,
})
|
返回结果:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
/ / 成功返回
{
"err_no" : 0 ,
"err_msg" : "success." ,
"corpus_no" : "15984125203285346378" ,
"sn" : "481D633F-73BA-726F-49EF-8659ACCC2F3D" ,
"result" : [ "北京天气" ]
}
/ / 失败返回
{
"err_no" : 2000 ,
"err_msg" : "data empty." ,
"sn" : null
}
|
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/qq_35037977/article/details/76274157