1.2.2 语音基本表示方法_智能语音处理-QQ阅读男生科幻网

上QQ阅读APP看书，第一时间看更新

目前，对语音信号进行研究一般都基于语音信号的数字表示，因此，语音信号的数字表示是进行语音信号数字处理的基础。语音信号数字化的理论依据是我们熟知的奈奎斯特采样定理，即只要采样频率大于语音信号最高频率的两倍，就可以用时域上周期抽取的样点来表示一个频带受限的语音信号。

语音信号的数字表示基本上可以分为两大类：波形表示和参数表示。波形表示仅仅是通过采样和量化的过程保存模拟语音信号的“波形”；而参数表示则是把语音信号表示成语音模型的特征输出。图1-1给出了语音信号的基本表示方法，其中参数表示采用的是语音信号产生模型。

图1-1　语音信号的基本表示方法

图1-2给出了常用的语音信号产生模型。

图1-2　语音信号产生模型

该模型包括激励源、声道模型和辐射模型三个部分。进一步，可以去掉其中的辐射模型部分，则该模型可以简化为仅有激励源和声道模型两部分，因此，该模型一般也简称为“声源-滤波器（Source-Filter）”模型。图1-2中，开关左侧部分为激励源部分，即声源。

在该模型中，激励源分浊音和清音两个分支，按照浊音/清音开关所处的位置来决定产生的语音是浊音还是清音。在浊音的情况下，激励信号由一个周期脉冲发生器产生，产生的序列是一个频率等于基音频率的脉冲序列；在清音的情况下，激励信号由一个随机噪声发生器产生。声道模型一般可以用一个全极点滤波器来表示。

“声源-滤波器”模型的参数一般可分为两类：一类是激励参数；另一类是声道参数。激励参数包括基音频率、清/浊音开关以及能量，声道参数主要是滤波器的系数。