智能语音处理
上QQ阅读APP看书,第一时间看更新

1.2.2 语音基本表示方法

目前,对语音信号进行研究一般都基于语音信号的数字表示,因此,语音信号的数字表示是进行语音信号数字处理的基础。语音信号数字化的理论依据是我们熟知的奈奎斯特采样定理,即只要采样频率大于语音信号最高频率的两倍,就可以用时域上周期抽取的样点来表示一个频带受限的语音信号。

语音信号的数字表示基本上可以分为两大类:波形表示和参数表示。波形表示仅仅是通过采样和量化的过程保存模拟语音信号的“波形”;而参数表示则是把语音信号表示成语音模型的特征输出。图1-1给出了语音信号的基本表示方法,其中参数表示采用的是语音信号产生模型。

图1-1 语音信号的基本表示方法

图1-2给出了常用的语音信号产生模型。

图1-2 语音信号产生模型

该模型包括激励源、声道模型和辐射模型三个部分。进一步,可以去掉其中的辐射模型部分,则该模型可以简化为仅有激励源和声道模型两部分,因此,该模型一般也简称为“声源-滤波器(Source-Filter)”模型。图1-2中,开关左侧部分为激励源部分,即声源。

在该模型中,激励源分浊音和清音两个分支,按照浊音/清音开关所处的位置来决定产生的语音是浊音还是清音。在浊音的情况下,激励信号由一个周期脉冲发生器产生,产生的序列是一个频率等于基音频率的脉冲序列;在清音的情况下,激励信号由一个随机噪声发生器产生。声道模型一般可以用一个全极点滤波器来表示。

“声源-滤波器”模型的参数一般可分为两类:一类是激励参数;另一类是声道参数。激励参数包括基音频率、清/浊音开关以及能量,声道参数主要是滤波器的系数。