文件名称:1语音特性-codesys2.3中文教程(学习plc编程的最好教程)
文件大小:2.37MB
文件格式:PDF
更新时间:2024-07-01 00:38:28
延迟-求和 麦克风阵列 语音增强
第二章语音增强的基础知识 第二章语音增强的基础知识 语言是人类特有的功能,通过语音相互传递信息是人类最重要的基本功能之 一。随着人类社会进入信息时代。语音通信在生产和生活中起着越来越重要的作 用,人们希望在任何时候、任何地点能够方便地进行语音通信。 然而人们在语音通信过程中,不可避免地会受到来自周围环境和传输媒介引 入的噪声以及其他讲话者的干扰,对原始语音造成污染。噪声不仅影响语音的质 量和清晰度,造成人耳听觉疲劳,还会影响语音通信系统的性能。 另一方面,语音识别技术近年来取得了很大进步。人机语音交互这种最自然、 便捷的人机通信方式,越来越受到人们的重视。但是目前的语音识别系统大多在 安静的环境下工作,在噪声环境中,语音识别系统会受到严重的影响,识别率显 著下降。而在实际应用中,不可避免的存在各种噪声,大大妨碍了语音识别技术 在实际生活中的应用。 语音增强是解决噪声污染的一种有效方法,其主要目的就是从带噪语音中尽 可能提取纯净的原始语音。由于噪声都是随机的,因而从带噪语音中提取完全纯 净的语音几乎是不可能的。在这种情况下,语音增强的目的主要有两个:一是改 善语音质量,消除背景噪声,使听者不感觉疲劳;另外一个目的是提高语音可懂 度,这是一种客观度量【3引。 2.1语音特性及人耳感知特性 语音增强不但与信号处理技术有关,而且涉及到人的听觉感知和语音学。另 外,噪声来源众多,不同应用场合的噪声特性也各不相同,因此很难找到一种普 遍适用的语音增强算法。语音特性【341、人耳感知特性以及噪声特性是各种语音增 强算法的基础【351。 2.1.1语音特性 语音是时变的、非平稳的随机过程。人类具有特别的发音系统,其生理结构 的变化速度有一定限度。在一段时问内(10ms。30ms),人的声带和声道形状具有相 对稳定性,可认为其特征是不变的,因此语音的短时谱具有相对稳定性。 语音可分为清音和浊音两大类。两者在时域和频域具有明显的差异。浊音在时 域上呈现出明显的周期性;在频域上有共振峰结构,而且能量大部分集中在较低