智能语音处理
上QQ阅读APP看书,第一时间看更新

2.4.1 基本概念

在自然界和工业领域中,存在着大量如前面图2-1所示的稀疏信号,由于这些信号的绝大多数样点值都接近零值,所以只需记录极少数非零值的位置和幅度就可以无失真地恢复原信号。按照Nyquist采样速率对这类信号采样(通常称为全采样)后,虽然能够无失真地恢复原有信号,但同时会得到没有有用信息的采样值,增加了传输和存储的负担。为了减少这些无用信息,通常需要做进一步压缩处理。那么,能不能简化全采样后再压缩的处理过程(如图2-7a所示),直接在低于Nyquist速率的情况下采样,同时还能得到无失真的信号呢?压缩感知理论就回答了这个问题。由于压缩感知理论重点解决了采样问题,因此有的文献也称之为压缩采样理论。在详细介绍压缩感知模型前,先通过实例简单介绍压缩感知的处理过程(如图2-7b所示)。

图2-7 不同采样处理过程的示意图

例如,有一个脉冲信号x=[1,0,…,0]T,其长度为100,只有一个非零元素。如果采用一个50×100的采样矩阵D去采样,那么得到的采样y=Dx,样点只有50个。存储、传输这50个样点,耗费的资源都降低了。经过传输、存储之后的y能恢复x吗?根据2.3.4节的介绍,由于x是稀疏的,D是“扁胖”的,那么在一定条件下是可以无失真恢复x的。

再如,有一个频率为200Hz的单频信号,对应的Nyquist采样速率大于等于400Hz。截取一秒的全采样信号,构成信号矢量x,其维度为400×1。如图2-8所示,虽然在时域上x并不稀疏,但通过傅里叶变换可以得到其在频域上的稀疏表示s,有x=Ψs。此时,如果采用一个“扁胖”的采样矩阵D对信号矢量x进行采样,得到的采样值y=Dx的样点数就少于400,采样速率将低于Nyquist速率。由于傅里叶变换矩阵Ψ是方阵,因此依然是“扁胖”的。同样,由于x是稀疏的,在一定条件下可以无失真恢复s,之后再重构得到x

图2-8 单频信号实例

上述示例说明了压缩感知的基本思路。由于利用了信号稀疏的先验信息,压缩感知可以实现欠Nyquist采样,降低了采样过程的复杂度,不再需要先进行全采样再压缩(如图2-9所示),具有很强的实用价值。该理论提出伊始,就作为核磁共振成像(Magnetic Resonance Imaging,MRI)图像处理的新方案得到了讨论[23]。单像素相机[24]、Xampling[25]样机等都是一些成功的应用。

图2-9 不同采样过程的输入/输出对比