文件名称:阿里智能语音V2.X SDM(MRCP-SERVER)技术文档(1).pdf
文件大小:1.74MB
文件格式:PDF
更新时间:2022-11-13 11:00:32
阿里
ASR 语音识别技术,也称为自动语音识别(Automatic Speech Recognition),简称 ASR,其目 标是将人类语音中的词汇内容转换为可读的文字。 TTS 语音合成技术,也称为自动语音合成(Text To Speech),简称 TTS,其目标是将文字转 成对应的语音声音。 NLU 自然语言理解技术(Natural Language Understanding),简称 NLU,有的叫做自然语言 处理(Natural Language Processing, NLP), 这里认为这两者是同一个概念,即:研究如 何让计算机读懂人类语言。 IVR 交互式语音应答技术(Interactive Voice Response),简称 IVR,本文将呼叫中心(Call Center)统一概称为 IVR。一般来说,由 IVR 通过 SDM 服务(实现了 MRCP 协议)调用 ASR、TTS、NLU 能力。 MRCP-SERVER 语音对话管理服务(Speech Dialogue Managerment),简称 SDM,也即是本文档所描述的 服务,是 MRCP 协议的服务端实现,对外用以和各类呼叫平台(比如华为呼叫中心、 avaya、freeswitch)进行对接,对内集成了