网络视频技术与应用实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 H.320标准框架

H.320标准发展于20世纪80年代后期,于1990年12月由CCITT(现ITU-T)通过该标准,称为“窄带可视电话系统和终端设备”。它是第一个低速率视频通信标准,成为目前仍被广泛接受的视频会议标准。它从总体上规定了视频会议系统体系框架,是一个“系统标准”,它包括许多应用于系统各个部分的ITU-T标准。2004年3月通过最新的第6版本。

H.320适用于窄带ISDN、ATM等电路交换数字网开展点到点及多点视频会议的标准。其带宽以64Kbps为基本增加量,称为“p×64”(p为1,2,3,…,30)。其应用包括ISDN和56Kbps交换网(速率从56Kbps~2Mbps)上的视频会议和电视电话。H.320支持双向实时音频和视频会话,同时还提供可选择的数据接口。此外,还支持多点会议、加密、远端摄像机的远程控制和广播应用。

2.2.1 H.320标准组成

1.H.320框架简介

从整体上看,H.320框架标准由H.200系列标准、G系列标准和T.120系列标准组成,主要包括通用体系、音频、多点会议、数据/远端控制、加密、数据会议六部分。

(1)H.200系列标准:H.320框架最核心的部分,是关于视频业务的系列标准。

(2)G系列标准:针对音频制定的系列标准。

(3)T.120系列标准:针对多点数据会议制定的系列标准。

为了对H.320框架协议的层次结构了解得更清晰,如图2-2所示,给出了H.320层次结构框架图。

图2-2 H.320协议层次结构框架图

H.320标准框架各部分主要协议如表2-3所示。

表2-3 H.320标准框架协议列表

2.H.320视频系统结构

从功能上看,视频系统应具有会议管理、协调处理、视频与音频处理、多点控制、通信服务等功能模块,其逻辑结构如图2-3所示。

图2-3 H.320视频系统结构

(1)会议管理:完成会议通知,初始化会议环境,组织召开会议;在会议进行中,管理与会者的身份与权力,监测系统运行状态;设置和调整系统各项性能参数。

(2)协调处理:主要提供共享白板、共享文件、共享应用等形式的协作方式。其中,共享白板的作用是实现与会人员的公共显示和修改窗口,实时传送修改信息;实现文件等数据的传送功能,完成文件传阅任务;具有面向对象链接与嵌入(OLE)功能。

(3)视频与音频处理:完成视频/音频信息的采集、转化,实时压缩本地媒体产生的数据,实时解压缩和播放远程媒体产生并经过网络传送过来的数据。

(4)通信服务和多点控制:具有网络管理的功能,各种媒体产生的信息流进行统一调度、传输,实现点对点、组播、广播等通信方式;完成相应进程的数据链接;保证网络传输效率和系统维护性能。

下面分别简要介绍H.320协议栈的H.200系列、G系列和T.120系列协议。

2.2.2 H.200系列标准

H.320协议中H.200系列标准主要包括:帧结构H.221标准,系统控制H.230和H.242标准,视频H.261和H.263编解码标准,多点会议H.231和H.243标准,实时远端摄像控制H.224和H.281标准,加密H.233和H.234标准,多点广播H.331标准。

1.H.221——帧结构

视频会议信号是通过数字信道以时分复用方式进行传输的,它的视频、音频、数据、控制信号必须以一定的顺序按照一定的结构在收发两端同步进行传送,这种按照一定顺序所组成的结构称为帧结构。

H.221是ITU-T于1988年11月通过的标准,是关于视频会议系统中64~1920Kbps信道传输音频、视频、数据、控制信令等复接成帧的传输格式。信道由单个64Kbps(称为B信道)或多个64Kbps组成,如H0(384Kbps)信道由6个64Kbps组成,H11(1536Kbps)信道由24个64Kbps组成,H12(1920Kbps)信道由30个64Kbps组成。H.221支持8个独立信道,但不是每次呼叫占用所有信道。2004年8月通过最新的第8版本。

单路B信道(64Kbps)帧结构,如图2-4所示。它由速率为8000Hz的8比特组构成,从上至下为1个8比特组,从左至右共有80个8比特组。每1比特从左至右构成1个子信道,前7个信道可视为传送视频、音频和数据的信道,第8信道作为服务信道(SC),用于传输端到端信令,包括比特分配信号(BAS)和帧定位信号(FAS),以及必要时所需的加密控制信号(ECS)。具有SC信道的64Kbps时隙称为“I”信道。

图2-4 单路B信道(64Kbps)帧结构

H0(384Kbps)、H11(1536Kbps)、H12(1920Kbps)信道结构,如图2-5所示。n=1时为单路H0(384Kbps)信道,它由6个64Kbps信道组成,BAS、FAS、ECS信号只在TS1时隙发送。对于多个H0连接,每个H0的TS1含有SC信道,其他TS不含SC信道。n=4时为单路H11(1536Kbps)信道,它由24个64Kbps信道组成,仅TS1含有SC信道。n=1时为单路H0(384Kbps)信道,它由30个64Kbps信道组成,仅TS1含有SC信道。

图2-5 H0(384Kbps)、H11(1536Kbps)、H12(1920Kbps)信道帧结构

2.H.230和H.242——系统控制

H.230是ITU-T于1990年12月通过的标准,是关于视听系统的帧同步控制和指示信号的标准,用于处理基于H.320的编解码器(CODEC)之间传送的控制信息。它定义了一系列命令和指示信号,即帧同步控制信号(C)和指示信号(I)。命令用来控制远端行为,指示信号用来提示远端事件的有用信息。该标准规定了多点相关消息由多点控制单元(MCU)强制操作模式,支持多种多点特性。H.230消息分为视频类、音频类、诊断类、多点控制类、字符和数字类等。2009年3月通过最新的第7版本。

H.242是ITU-T于1990年12月通过的标准,是关于视听系统中使用2Mbps以上数字信道的视频终端之间的通信标准。它定义了视频会议系统点到点的通信规程,是没有多点控制单元(MCU)参与的通信规程。该建议包含了H.320呼叫建立和操作的基本过程,包括能力交换、模式初始化和转换、启动多个类型信道及通用H.320终端的过程。2009年3月通过最新的第7版本。

3.H.261和H.263——视频编解码

H.261是ITU-T于1988年11月通过的标准,是关于p×64Kbps(p为1,2,3,…,30)速率下的视频会议视频编码的标准。它是ITU-T最早制定的关于视频编码的国际标准,广泛用于H.320、H.323视频会议系统。它提供QCIF和CIF两种图像格式。1993年3月通过最新的第3版本。

H.263是ITU-T于1996年3月通过的标准,是关于低码率视频会议视频编码的标准。这个标准在H.261的基础之上加以改进,使得在低速率下获得更好的图像质量,主要用于384Kbps以下速率的应用场合,在低速的H.320、H.323、H.324等视频会议系统中广泛应用。它提供SQCIF、QCIF、CIF、4CIF、16CIF五种图像格式。

H.263+是ITU-T于1998年2月修订发布H.263标准的第2版本,非正式地称为H.263+标准。它在保留原H.263标准的核心句法和语义不变的基础上,增加了12个选项以提高编码压缩效率,增强了异构网络环境的适应性,提高了可扩展性。

H.263++是ITU-T于2000年11月修订发布H.263标准的第3版本,在H.263+的基础上,增加了增强型的参考帧选择(ERPS)、数据分片的模式(DPS)、保证增强型反向兼容性的附加信息3个选项,提高码流在恶劣信道上的抗误码性能和编码压缩效率。2005年1月通过最新版本。

H.263最初设计为基于H.324的系统进行传输,后来逐步成功地应用于H.320、H.323、SIP和流媒体等系统。

有关视频编解码技术详细介绍,参见第3章。

4.H.231和H.243——多点会议

H.231是ITU-T于1993年3月通过的标准,是关于视听系统中使用2Mbps以上数字信道的多点控制单元的通信标准,它规定了多点会议中MCU的视频、音频、信道接口、数据时钟以及最大端口数等接口标准。1997年7月通过最新的第3版本。

H.243是ITU-T于1993年3月通过的标准,是关于视听系统中使用2Mbps以上数字信道的3个以上视听终端与MCU之间通信过程的规程,是H.231的一个补充。它规定了3个以上视听终端参与一个会议的多点操作标准,主要包括终端与MCU之间建立通信的初始化过程、终端与MCU编号、多个MCU互连、视频切换、数据广播、主席控制和音视频模式等内容;主要适用于多点会议系统通信和星形网络结构中多个MCU建立呼叫连接,是多点通信中较为重要的一个通信协议规程。多个MCU设置主、从关系,主MCU处于星形组网中心。2005年10月通过最新的第5版本。

5.H.224和H.281——实时远端摄像控制

H.224是ITU-T于1994年11月通过的标准,是关于视听系统中运行在H.221的LSD/HSD/MLP信道上的单工应用实时控制规程,也称H.DLL。它规定了在帧结构中的低速数据(LSD)信道、高速数据(HSD)信道、多层协议(MLP)信道的能力,以及通过上述三种不同信道实现远端摄像机的实时控制,是H.320标准提供的可选实时远端设备控制规程。2005年1月通过最新的第3版本。

H.281是ITU-T于1994年11月通过的标准,是关于电视会议系统基于H.224的远端摄像机控制规程,也称H.FECC,主要包括规程的各要素及字段格式,通过H.224发送高优先级消息,对远端多个摄像机选择、位置预置,以及摄像头的摇动、倾斜、推拉等操作进行远程控制。H.281是H.224的应用标准,两个标准必须配合使用。

6.H.233和H.234——加密

H.233是ITU-T于1993年3月通过的标准,是关于视听业务的保密系统的标准,它包括加密过程和算法选择,可以使用快速数据加密算法(FEAL),英国加密算法(B-CRYPT)和数据加密标准(DES)等国际标准化组织(ISO)认可的加密算法。密钥长度依赖于使用的算法,可以是无限制的。2002年11月通过最新的第3版本。

H.234是ITU-T于1994年11月通过的标准,是关于视听业务的加密密钥管理和认证系统的标准,它包括使用ISO8732密钥管理标准、扩展Diffie-Hellman密钥交换协议和公钥加密算法(RSA)的密钥交换与认证。2002年11月通过最新的第3版本。

7.H.331——广播

H.331是ITU-T于1993年3月通过的标准,是关于广播类型的视听多点系统和终端设备的标准,它可以利用ISDN数字交换的分布功能,将视听信号通过传输,广播到多个接收端。所使用ISDN信道(B、H0、H11/H12)提供传输能力。该标准独立于H.320,但作为H.320的广播多点系统,与H.320有着密切关系。本标准的特点是信息提供者与信息接收者之间经过交换设备进行信息转发,通信过程不需协商,且信息为单向传输。

2.2.3 G系列标准

1.基本音频编码模式

G.711是ITU-T于1972年12月通过的标准,是H.320基本音频编码模式,是采用8kHz采样频率的对数脉码调制(log-PCM)的音频编解码标准。该标准规定了PCM的A律或μ律两种不同的语音编解码标准,音频传送带宽为64Kbps,自动唇音同步,图像相对于语音延迟小于40ms。一直以来也是数字电话网主要采用的编码方法,但它在占用带宽方面效率较低。1998年11月通过最新的第5版本。

G.722是ITU-T于1987年2月通过的标准,是宽带音频编码模式。它采用自适应差分脉冲编码调制(ADPCM)的语音编码标准,音频传送带宽为48Kbps、56Kbps或64Kbps。1998年11月通过最新的第2版本。ITU-T正在发展一个“G.16K”的16Kbps宽带音频编码的新标准,将替代G.722。

G.728是ITU-T于1992年9月通过的标准,是窄带音频编码模式。它采用低时延码自激励线性预测(LD-CELP)语音编解码标准,音频传送带宽是16Kbps,总延迟约1.875ms,具有很好的语音音质。

2.可选音频编码模式

G.723.1是ITU-T于1996年3月通过的标准,是窄带音频编码模式,它采用代数码激励线性预测(ACELP)和多脉冲最大似能量化(MP-MLQ)的双速率语音编解码标准,音频传送带宽可为5.3Kbps或6.3Kbps,延迟为67.5ms。在H.320系统中是可选编码标准。2006年5月通过最新的第2版本。

G.729是ITU-T于1996年3月通过的标准,是窄带音频编码模式,它采用共轭结构的算术码激励线性预测(CS-ACELP)的语音编解码标准,音频传送带宽可为8Kbps,延迟为35ms。在H.320系统中是可选编码标准。2007年1月通过最新的第3版本。

有关音频编解码技术详细介绍,参见第3章。