2.2 音频素材的采集方式及其硬件
2.2.1 音频素材的采集方式
在多媒体作品中,声音是必不可少的媒体元素。音频数据包括背景音乐、歌曲演唱、乐器演奏、解说词、电影或动画配音等,另外还包括碰撞、敲击、射击、观众掌声、喝彩以及雷电等各种特殊效果声等,这些音频素材在多媒体开发环境里可作为常用的声音库。音频素材的采集主要通过3种方法。
1.直接使用音频素材库资源
目前,不少出版商出版了声音素材库,有些素材光盘收集了大量的WAV、MID或MP3格式的声音文件,内容范围很广,有各种各样的背景音乐、流行乐、舞曲、自然音效,也有许多人与动物发出的声音、卡通与特效音响等,这些声音一般是经过专业人员精心挑选制作而成的,具有较高的质量。但CD光盘上的音乐是一种特殊的格式,不能直接用于多媒体制作,需要使用专门的音频抓轨软件将CD光盘上的音乐提取并保存为新的音频文件后,才可用于多媒体制作。
2.通过互联网下载音频素材资源
随着互联网的蓬勃发展,互联网的资源正以几何量级爆炸式增长,其中音频素材资源也非常丰富。互联网资源的共享性,使得音频素材资源的获取更加方便快捷。只要有需求,几乎都可以在互联网上找到。有许多专门网站提供音频素材资源的试听与下载,如站长之家素材下载、Flash8(闪吧)音源音效等。目前,通过互联网下载音频素材资源是多媒体开发人员获取使用最为广泛一种方式。
3.使用多媒体计算机采集音频素材
还可以使用多媒体计算机将来自录音、录像磁带的模拟声音转换为数字音频文件,或者通过话筒录制数字音频文件。最简单的方法是采用Windows自带的“录音机”软件录制声音,并进行简单的声音编辑。但是“录音机”软件不适宜录制比较长的声音,如果用户需要录制比较长的声音,或者要对录制的声音进行高级的处理,建议用户使用专业的软件,如使用Adobe Audition 3.0软件进行录制,随后对声音进行编辑和处理。
在进行录音时,要求周围环境十分安静,如果在非专业的录音室中录音,噪声是不可避免的,但应该尽可能地减少常见的噪声,如空调机、荧光灯的嗡嗡声或通过敞开的窗户进来的声音以及计算机和显示器的声音等。录音的质量与硬件的质量很有关系,如果用户的麦克风、声卡质量都很好,并使用能减少电磁干扰的屏蔽电缆来连接麦克风和声卡,则录制出来的效果会比较好。声卡通常都有3个模拟信号输入插孔:一个用于麦克风(MIC)输入插孔,一个用于线路音频信号(Line In)输入插孔,一个是声音输出插孔(Speaker)。麦克风的输入灵敏度比较高,它可以把声音转换、放大成规定幅度的模拟电信号。线路输入能接受范围在1~2V的音频信号,并能接收来自录音机、电视、收音机和CD机等各种音源的立体声信号。另外,音乐键盘、电吉他或声音混合器的模拟信号输出也可以被输入到计算机声卡的线路输入插孔。
2.2.2 数字音频基础
多媒体涉及到多方面的音频处理技术,如音频采集、语音编码/解码、文语转换、音乐合成、语音识别与理解、音频数据传输、音频视频同步、音频效果与编辑等。其中数字音频是个关键的概念,它指的是一个用来表示声音强弱的数据序列,它是由模拟声音经抽样(即每隔一个时间间隔在模拟声音波形上取一个幅度值)量化和编码(即把声音数据写成计算机的数据格式)后得到的。模拟数字转换器把模拟声音变成数字声音;数字模拟转换器可以恢复出模拟来的声音。
一般来讲,实现计算机语音输出有两种方法:一是录音/重放,二是文语转换。第二种方法是基于声音合成技术的一种声音产生技术,它可用于语音合成和音乐合成。而第一种方法是最简单的音乐合成方法,曾相继产生了应用调频(FM)音乐合成技术和波形表(Wavetable)音乐合成技术。
常见的声音文件格式主要有6种。
1.WAV格式
WAV格式作为经典的Windows多媒体音频格式,应用非常广泛,它使用3个参数来表示声音:采样位数、采样频率和声道数。声道有单声道和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz(44kHz)三种。WAV文件所占容量=(采样频率×采样位数×声道)×时间/8(1字节=8bit)。故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价是文件太大。
2.MP3文件
MP3是现在最流行的声音文件格式,因其压缩率大(将声音用10∶1甚至12∶1的压缩率压缩)。MP3音乐是以数字方式储存的音乐,如果要播放,就必须有相应的数字解码播放系统,一般通过专门的软件进行MP3数字音乐的解码,再还原成波形声音信号播放输出,这种软件就称为MP3播放器,如TTPlayer(千千静听)、Winamp等。
3.Real Audio文件
扩展名RA、RAM、RM都是Real公司成熟的网络音频格式,采用了“音频流”技术,强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。在制作时可以加入版权、演唱者、制作者、E-mail和歌曲的Title等信息。RA适合于网络上进行实时播放,是目前在线收听网络音乐较好的一种格式之一。
4.MIDI文件
现在我们用的最多的音频名词之一MIDI(Musical Instrument Digital Interface)是作为“乐器数字接口”的缩写出现的,并用它来泛指数字音乐的国际标准。由于它定义了计算机音乐程序、合成器及其他电子设备交换信息和电子信号的方式,所以可以解决不同电子乐器之间不兼容的问题。另外,标准的多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音乐,所需的存储量最少。
至于MIDI文件,是指存放MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个通道的演奏定义。文件包括每个通道的演奏音符信息:键通道号、音长、音量和力度(击键时,键达到最低位置的速度)。由于MIDI文件是一系列指令,而不是波形,它需要的磁盘空间非常少,并且现装载MIDI文件比波形文件容易得多。
5.WMA文件
Windows Media Audio的缩写,微软在开发自己的网络多媒体服务平台上主推ASF(Audio Steaming Format),这是一个开放支持在各种各样的网络和协议上的数据传输的标准。它支持音频、视频以及其他一系列的多媒体类型。而WMA相当于只包含音频的ASF文件。WMA文件在80kbps、44kHz的模式下压缩比可达1∶18。而且压缩速度比MP3提高一倍。
6.其他音频格式
VQF是一种音频压缩技术。它的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到1∶18左右,甚至更高。而像MP3、RA这些广为流行的压缩格式一般只有1∶12左右,但仍然不会影响音质。
AIF/AIFF是苹果公司开发的一种声音文件格式,支持MAC平台,支持16位44.1kHz立体声。
AU是SUN的AU压缩声音文件格式,只支持8位的声音,是互联网上常用到的声音文件格式,多由SUN工作站创建。
2.2.3 声卡
声卡,即音频卡,是多媒体计算机的主要部件之一,如图2-18所示。它包含记录和播放声音所需的硬件。声卡的种类很多,功能也不完全相同,但它们有一些共同的基本功能:能录制话音(声音)和音乐,能选择以单声道或双声道录音,并且能控制采样速率。声卡上有数模转换芯片(DAC),用来把数字化的声音信号转换成模拟信号,同时还有模数转换芯片(ADC),用来把模拟声音信号转换成数字信号。
图2-18 声卡
1.声卡的主要功能
声卡是集播放数字音乐、录音、语音通信、实时的效果器、界面卡、音频解码、合成器等多种功能的一种多媒体板卡,其功能包括:录制、编辑和回放数字音频文件,控制各种声源的音量并加以混合,在记录和回放数字音频文件时进行压缩和解压缩,采用语音合成技术让计算机朗读文本,初步的语音识别,MIDI接口和输出功率放大,等等。
2.声卡的组成原理
声卡的工作原理其实很简单。我们知道,麦克风和喇叭所用的都是模拟信号,而计算机所能处理的都是数字信号,声卡的作用就是实现两者的转换。从结构上分,声卡可分为模数转换电路和数模转换电路两部分,模数转换电路负责将麦克风等声音输入设备采到的模拟声音信号转换为计算机能处理的数字信号;而数模转换电路负责将计算机使用的数字声音信号转换为喇叭等设备能使用的模拟信号,送往混音器中放大,最后输出驱动扬声器发声。如图2-19所示是声卡的组成原理框图。
图2-19 声卡组成原理框图
从框图可以看出,声卡的核心器件是数字信号处理器和音乐合成器,它们决定了声卡的性能优劣。最新的声卡已经将这两个芯片集成到一块芯片内,使声卡集成度提高,性能和质量也随之提高。
3.声卡的性能指标
采样和量化能力。这是衡量音响器材音质好坏的性能指标,通常采样频率和量化位数越高,声卡产生的声音就越细腻。采样频率一般有3种标准:11.025kHz(语音等级)、22.05kHz(音乐等级)、44.1kHz(高保真效果等级)。采样频率的高低直接影响声卡的频率响应范围。量化位数通常有两种标准:8位和16位。对于语音信号,8位量化位数基本可以满足要求;但是对于音量幅度变化很大的交响乐,就需要16位量化音频质量。
芯片类型。采用什么样的核心器件是决定声卡性能高低的主要因素。声卡专用的数字信号处理器集成度很高,不但具有数字信号处理能力,而且还集成了A/D转换器,甚至集成了音乐合成器。这样的芯片处理能力很强,对CPU的依赖性小,因此采用这种芯片的声卡性能好,但是价格较高。
总线类型。声卡依其与计算机的连接方式不同,分为ISA总线、PCI总线和通过USB电缆连接的外置方式。其中,ISA总线声卡属于比较老的产品,安装和设置复杂,而且目前新款主板都已取消了ISA插槽,ISA声卡根本无法安装;PCI总线声卡是当今市场上的主流产品,一般计算机都可装备,由于支持即插即用PNP,因此安装和设置都很方便;USB声卡由于与计算机连接方式简单,便于携带,因此广泛应用于台式机、笔记本和一些家用设备中。
输出声道数。声卡所支持的声道数的增加也是声卡技术发展的重要标志之一,它决定了声卡的基本功能。通常有2声道(即立体声)、2.1声道、4.1声、5.1声道甚至7.1声道等,多通道声卡是营造逼真音效环境的先决条件。
4.声卡的外部接口
声卡一般有4~6个外部接口(俗称插口或插座),用于连接外部的音频设备,如图2-20所示。不同厂商和不同档次声卡的外部接口略有不同。下面简要介绍声卡各个外部接口的作用。
图2-20 声卡的外部接口
线性输入接口(Line In)。用来连接外部音频设备,如录音机、CD唱机和音响等,进行播放或录音。
话筒输入接口(MIC)。用来连接话筒,直接输入现场的声音信号,使计算机具有录音机的功能。
线性输出接口(Line Out)。用来连接外部音频设备的Line In输入口,也可连接大功率有源音响。
扬声器输出接口(Speaker)。用来连接扬声器,从声卡的内置功率放大器向扬声器输出声音。
游戏杆/MIDI接口(Joystick/MIDI)。连接游戏杆或MIDI设备。用户可以购买可选的MIDI套件,它允许同时插入游戏杆和MIDI设备。