自然语言交流系统 phxnet团队 创新实训 项目博客 (七)

时间:2022-12-13 03:35:02

在本项目中使用到的“语音转文本”的技术总结:

语音转文本部分是调用的科大讯飞的在线语音,它的激发方式是按键,通过按钮触发开启安卓设备的录音,此部分需要在源码中写入关于安卓权限的要求,来调用安卓的录音权限,当按钮被激发,则开始进入语音录制阶段,将麦克风所录下的语音实时的传给云端的科大讯飞服务器。、

从声音之中得到文本:

public void GetWordFromVoice() {

boolean isShowDialog = mSharedPreferences.getBoolean("iat_show", true);

if (isShowDialog) {

showIatDialog();

} else {

if (null == iatRecognizer) {

iatRecognizer = SpeechRecognizer.createRecognizer(this);

}

if (iatRecognizer.isListening()) {

iatRecognizer.stopListening();

} else {

}

}

}

所借用的接口是科大讯飞开放平台提供的接口,实现实时的语音传输,通过云端的服务器利用科大讯飞的语音包将语音转为文字,传回客户端,这样就实现了客户端的语音转文字,拿到需要的文字之后,客户端的处理方式是将收到的text文本传入unity3D之中,再通过unity3d将文字text发送给服务器端,下一步由服务器进行语音的智能识别,主谓短语的切分,调用相关的库进行回复。

以下是调用VoiceToText的接口的方法:

@Override

public void onClick(View v) {

switch (v.getId()) {

case R.id.button1:

VoiceToWord voice = new VoiceToWord(MainActivity.this,"54ae8c54");

voice.GetWordFromVoice();

break;

}

}

声音监听:

private SpeechListener listener = new SpeechListener() {

@Override

public void onData(byte[] arg0) {

}

@Override

public void onCompleted(SpeechError error) {

if (error != null) {

System.out.println("user login success");

}

}