这篇文章的标题起得如此长,实在是为了区分“谱”与“谱密度”。谱的英文原词为spectrum,私以为是函数图象,却又不够准确。信号就是时间的函数,那怎么不把信号称为谱?可知谱是函数图像中的某一类而已。每每提及谱,都和频率脱不了干系,而此文的来由,也正是我对Parseval恒等式突发的好奇心。Parseval恒等式是傅里叶变换的一个重要性质。说到此,学识渊博的读者,您自然很熟悉,傅里叶变换将信号从时域或者空域变换到频域上,产生频谱。这谱,自然和频率,有着天然的不可分割性。
罢了,再往下说就变成考证了。即使本文意为一篇科普,也须得有理科文章的简洁。
且说上文提到的Parseval恒等式,老师有提到该等式的intuitive sense是:傅里叶变换的原信号和频谱之间是能量守恒的。这当然是不错的解释,但却不够shocking,一个shocking的解释是,傅里叶变换之后的频谱保留了原信号的所有信息。我当时就震惊了。当然,只要想到傅里叶变换是可逆的(即一一对应),也就不那么震惊了。傅里叶变换的另一个令人震惊的事实是:Gaussian分布的密度函数 $e^{-x^2/2}$ 是唯一的一个傅里叶变换不变函数。
Gaussian密度函数的一阶导数与哺乳动物视觉感知系统主视皮层简单细胞的感受野(cortical receptive field)具有相似的结构。
泛函分析中,Gaussian密度函数的极限($\sigma\to\infty$)是delta-dirac函数 $\delta(x)$,即脉冲函数。
更简单地,在大学一年级的数学分析课程中,Gaussian密度函数的积分是 $\sqrt{\pi}$。
总而言之,Gassian分布具有许多异常完美的性质,被它震惊也不是一回两回了。
言归正传,信号经过傅里叶变换之后产生频谱,频谱是一个以频率为自变量的函数。频谱在每一个频率点的取值是一个复数。一个复数由模和辐角唯一地确定,所以可将频谱分解为幅度谱(即复数的模关于频率的函数)和相位谱(即复数的辐角关于频率的函数)。到此,三种谱已经讲完了,果然学问就像窗户纸,一捅破就觉得聊胜于无。
那什么是能量谱密度(energy spectral density)和功率谱密度(power spectral density)?在英语只有韩梅梅水平的我看来,energy和power不都是能量么,殊不知power原来是功率的意思。
既然说到了英语,在对两个谱密度进行阐述之前,我们要再跳戏一下,说说幅度的概念。在英语中,幅度有两个词:amplitude和magnitude,在大多数情况下(包括本文),它们是没有区别的,除了在某个特定的领域(如物理领域),amplitude代表整个信号偏离x轴的最大绝对值,magnitude代表信号上某一点偏离x轴的绝对值。更清晰的阐述如下:
peak amplitude, often shortened to amplitude, is the nonnegative value of the waveform\'s peak (either positive or negative).
instantaneous amplitude of x is the value of x(t) (either positive or negative) at time t.
instantaneous magnitude, or simply magnitude, of x is nonnegative and is given by |x(t)|.
可见,amplitude是一个全局概念,而magnitude是一个瞬时概念。
在谈及FFT和wavelets的大多数情况下,将amplitude和magnitude认为是同一概念,即瞬时幅度。
信号$f(t)$在$t$处的瞬时幅度是$f(t)$的模,即$|f(t)|$;
信号$f(t)$在$t$处的瞬时相位是$f(t)$的辐角,即$Arg f(t)$ 或者 $\angle f(t)$;
信号$f(t)$在$t$处的瞬时功率是$f(t)$的模的平方,即$|f(t)|^2$。
信号的能量是一个全局概念,是瞬时功率的积分值,即$||f(t)||^2=\int_{-\infty}^{\infty}|f(t)|^2 dt$。注意$|f(t)|$和$||f(t)||$的区别,前者是瞬时概念,即信号在某一点的瞬时幅度,后者是全局概念,即整个信号的能量的开方。
需要注意的是,通常所指的能量谱和能量谱密度是一个概念;功率谱和功率谱密度是一个概念,而且功率是指平均功率。
时域上的能量公式:$$ E(f)=\int_{-\infty}^{\infty}|f(t)|^2 dt $$
其中绝对值号代表取模,当信号是实信号时,显然绝对值号可以去掉,变成$$ E(f)=\int_{-\infty}^{\infty}f(t)^2 dt $$
根据Parseval能量恒等式(Parseval’s Identity),能量也可认为是$f(t)$的傅里叶变换的模的平方在频域上的积分。
频域上的能量公式:$$ E(f)=\int_{-\infty}^{\infty}|\hat{f}(\omega)|^2 d\omega$$
从上述积分可以看出,信号的能量谱密度在某个频率点上的取值就是信号在某个频率上的瞬时功率$|\hat{f}(\omega)|^2$。
从上面的公式可以看出,信号的能量可能是无穷。当信号的能量无限时,只能通过平均功率来了解该信号。因为能量$E(f)$和时间长度$\triangle T$之比就是平均功率$P(f)$,即:$$P(f)=\frac{E(f)}{\triangle T}$$
易知:当信号在$t \in (-\infty,\infty)$的平均功率有限时,能量是无限的;当信号在$t \in (-\infty,\infty)$的能量有限时,其平均功率为0。能量有限的信号称为能量信号;平均功率有限的信号称为功率信号。
为方便叙述,记$$f_{T}(t)=\left\{\begin{array}{lll} f(t)& , & |t|\leq T\\ 0&,&|t|>T\end{array}\right.$$从而平均功率的公式为:$$P(f)=\lim_{T\to\infty}\frac{\int_{-T}^{T}|f_{T}(t)|^2 dt}{2T}=\lim_{T\to\infty}\frac{\int_{-T}^{T}|\hat{f_{T}}(\omega)|^2d\omega}{2T}$$
从上述的积分可以看出,信号的功率谱密度为:$$ PSD(f) = \lim_{T\to\infty}\frac{|\hat{f_{T}}(\omega)|^2}{2T}$$
对于比信号更复杂的随机过程$X(t)$来说,$P(f)$是一个随机变量,所以其平均功率$P$必须取加权平均$E$(注意这里的$E$不是能量):$$P=E[P(f)]=E[\lim_{T\to\infty}\frac{\int_{-T}^{T}|\hat{f_{T}}(\omega)|^2d\omega}{2T}]=\lim_{T\to\infty}\frac{\int_{-T}^{T}E[|\hat{f_{T}}(\omega)|^2]d\omega}{2T}$$
其功率谱密度为:$$PSD = \lim_{T\to\infty}\frac{E[|\hat{f_{T}}(\omega)|^2]}{2T}$$
参考文献:
[1] Wikipedia. “Spectral Density”.
[2] Scott Miller & Donald Childers. “probability and random processes with applications to signal processing and communications”. section 10.1 Power Spectral Density.