本章主要介绍AI语音交互的原理,包括语音交互的流程以及各流程节点所涉及的相关知识,如语音采集、语音识别、自然语言处理、语音合成等。
2.1 AI语音交互
AI语音交互通俗点说就是人与机器间进行语音理解和交互的过程。
AI语音交互流程是从用户输入语音信号开始,经过语音采集得到原始音频文件,再经过语音识别技术(ASR)、自然语言处理技术(NLP),最后得到机器反馈的过程。
机器反馈一般分为两种:一种是只有文字反馈既展示自然语言处理后的文字内容;另一种是语音反馈,语音反馈就需要语音合成技术(TTS),将理解反馈文字信息转化为声音播报出来。
AI语音交互流程图如图2-1所示。
图2-1 AI语音交互流程
由图2-1所知,AI语音交互包括语音输入(语音采集)、语音识别、自然语言处理、语音合成和语音输出这样一个过程。
总结
如果大家对人工智能(AI)测试有兴趣,欢迎大家加本人微信:wxid_ptea4d8gx4tx12;QQ群:775460627。