上QQ阅读APP看书,第一时间看更新
第1章 音频基础
1.1 音频信号的数字化
音频信号(audio signal)是带有语音、音乐和音效的有规律的声波的频率、幅度变化信息载体。音频信号的数字化一般经过采样和量化的方法来实现,量化精度和采样频率是音频信号数字化的两个重要参数[1]。
量化是对模拟音频信号的幅度轴进行数字化,决定了模拟信号数字化的动态范围。通常高质量的数字音频信号最流行的描述样本格式是16b线性量化,如Windows可视音频格式(Windows audio visual,WAV)和音频交换文件格式(audio interchange file format,AIFF)。另一种较低质量的音频信号格式是8bu律或a律的非线性量化方式。这些量化方法使信号产生了一些畸变,在8bitsu律中显得更为明显。量化位越高,信号的动态范围越大,数字化后的音频信号就越可能接近原始信号,但所需的存储空间也越大。
采样率是指声音信号从模拟信号转换成数字信号过程中单位时间内采样的次数。音频信号的采样率一般为8、9.6、10、12、16、22.05、44.1和48kHz。采样频率越高,声音的还原就越真实、越自然。在当今的主流采集卡上,采样频率一般共分为22.05、44.1、48kHz三个等级,22.05kHz只能达到FM广播的声音品质,44.1kHz则是理论上的CD音质界限,48kHz则更加精确一些。对于高于48kHz的采样频率人耳已无法辨别,所以在计算机上没有多少使用价值。采样率影响数据隐藏量,因为它给出了可用频谱的上限,假设信号的采样频率为8kHz,则引入的修改分量的频率不会超过4kHz。