原理:假设噪声为加性噪声,通过从带噪语音谱中减去对噪声谱的估计,就可以得到纯净的信号谱。
缺点:求减过程需要十分的谨慎,以免语音失真。减得太多语音失真,减得太少,则残留噪声过多
-
- 原理的详细说明
假设接收信号是y(n),纯净语音信号是x(n),加性噪声d(n),则
y(n)=x(n)+d(n)
两边做DFT,得
Y(w)=X(w)+D(w)
假设语音与噪声不相关,则纯净语音的功率谱估计可以表示如下
用极坐标表示,且噪声的相位用带噪语音的相位表示,可得纯净的语音信号的谱的估计
其中,是无语音活动时噪声幅度谱估计。
注意:增强信号的幅度谱可能是负值,而幅度谱不应该是负值。因此,为了避免出现负值问题,其中一个解决办法是半波整流,即
原理图
-
- 谱减法的缺点
- 使用半波整流会导致信号帧频谱的随机频率位置上出现小的、独立的峰值。转换到时域以后,这些峰值听起来就像帧与帧之间频率随机变化的多频音
- 使用带噪信号相位,可能产生比较粗糙的合成语音质量。带噪信号相位与调整以后的频谱相结合产生增强的时域信号,在此之后才看得到增强的信号相位。这是由于相位噪声对语音质量的影响并不是太大,尤其是在高信噪比的时候(>5dB)的时候,在低信噪比(<0dB)的时候,带噪相位会导致语音信号变得粗糙,并达到可能被听觉所感知的程度,进而降低语音质量。