随着AI快速发展的今天,语音识别也成为众多设备的标配,语音识别开始被越来越多人的关注,国外微软、苹果、谷歌,国内的科大讯飞、思必弛、云知声等厂商都在研发语音识别新策略新算法,似乎人类与语音的自然交互渐行渐近。
语音识别是以语音的研究为对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。
语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元。
一套完整的语音识别系统,工作过程分为7步:
1.对语音信号进行分析和处理,除去冗余信息。
2.提取影响语音识别的关键信息和表达语言含义的特征信息。
3.紧扣特征信息,用最小单元识别字词。
4.按照不同语言的各自语法,依照先后次序识别字词。
5.把前后意思当作辅助识别条件,有利于分析和识别。
6.按照语义分析,给关键信息划分段落,取出所识别出的字词并连接起来,同时根据语句意思调整句子构成。
7.结合语义,仔细分析上下文的相互联系,对当前正在处理的语句进行适当修正
语音识别、图像识别均为模式识别中的主要应用,有兴趣的可以多学习一下
1.模式识别应用于哪些领域,模式识别技术的发展趋势
http://www.duozhishidai.com/article-15389-1.html
2.计算机视觉与图像处理、模式识别和机器学习,之间有什么关系?
http://www.duozhishidai.com/article-4119-1.html
3.语音的识别过程主要分哪几步,常用的识别方法是什么?
http://www.duozhishidai.com/article-1739-1.html