2.3 H.323标准框架
为了解决在无服务质量(QoS)保证的分组网络上展开多媒体会议,于1996年11月通过H.323标准的第1版,成为“基于分组网络的多媒体通信系统”的标准。2009年12月通过最新的第7版本。
H.323标准制定的初衷是针对不提供QoS保证的局域网技术制定,但只要带宽时延满足要求,同样可以应用在更广范围的城域网和广域网。
H.323标准沿用传统电信网的设计理念,兼顾传统PSTN呼叫流程和IP网特点,吸取了许多电信网的组网、互联和运营经验,能与PSTN网、窄带视频业务以及其他数据业务和应用网互联互通,在组建大规模VoIP网络方面凸显了其技术优势。H.323标准涵盖了各种独立设备、个人计算机技术以及点对点与点对多点的视频会议等诸多方面,解决了视频会议中呼叫与会话控制、多媒体与带宽管理等许多问题。整个体系结构较之H.320略显庞大和复杂。
2.3.1 标准组成
1.H.323框架简介
H.323是建立在ITU-T有关多媒体协议、ISDN的H.320、B-ISDN的H.321和PSTN的H.324等标准的基础之上的一组标准,其编码机制、协议范围和基本操作类似于ISDN的Q.931信令协议的简化版本。
从组成结构上看,H.323是一个框架性建议,主要由H.200系列标准、G系列标准、T.120系列标准和实时传输协议组成。
H.200系列标准是H.323框架最核心部分,是关于视听业务的系列标准。
G系列标准是关于音频编码的系列标准。
T.120系列标准是关于多媒体会议的数据规程。
实时传输协议是关于媒体可靠传输的控制标准。
2.H.323体系结构
从体系结构上看,将H.323标准框架从终端控制与管理、媒体控制、数据应用、传输层和IP网络层等方面做了比较详细的规定,为网络语音和视频系统的拓展性和兼容性提供了良好条件。H.323最初是针对局域网上无保证服务质量的多媒体通信协议而提出的,现已逐渐发展成为满足IP视频通信技术复杂要求的协议系列,其体系结构如图2-6所示。
(1)IP网络层。它是H.323标准的基础,应支持IP单播、组播协议,既可支持信息的单一传送,确保信息的私密性,也可以组播方式同时对多个不同用户发送,降低网络负载,节省网络带宽。
图2-6 H.323标准框架
(2)传输层。它是H.323标准的应用有效传输的保证,主要包括可靠传输协议(TCP)和不可靠传输协议(UDP)。
(3)终端控制与管理。它是H.323标准的核心部分,主要由H.245媒体控制、H.225.0呼叫控制信令和RAS(Registration/Admission/Status,注册/许可/状态)组成。通过H.245媒体控制信道、H.225.0呼叫控制信令信道和RAS混合呼叫信令信道实现控制与管理,可以采用专用控制协议与H.225、H.245等标准协议相结合的方式,根据不同的功能特点使用不同的控制协议,保证系统高效、灵活的控制管理。
(4)媒体控制。它是H.323标准的媒体有效传输的主体部分,主要包括音频编解码、视频编解码和实时传输与控制协议(RTP/RTCP)。
音频编解码主要包括G.711协议(必选)、G.722、G.723.1、G.728、G.729等协议,编码器使用的音频标准必须由H.245协议协商确定,H.323终端通过本身具有的音频编解码能力进行非对称操作,例如,以G.711发送,以G.729接收。
视频编解码主要包括H.261、H.263和H.264协议,完成对视频码流的冗余压缩编码,可根据网络带宽、设备性能进行灵活选择,提供QCIF、CIF、4CIF的图像质量。
RTP/RTCP提供同步、排序、缓存、重传服务,可适应质量较差的信道和网络环境。媒体编码信号封装在RTP协议中,RCTP提供QoS监视功能,辅助RTP协议完成实时媒体传输。
(5)数据应用。它是H.323标准的多媒体应用部分,是可选功能,其标准采用T.120系列多媒体会议的数据规程。
H.323标准是整个系统的框架规范,它是专门为IP网络上实现多媒体通信而制定的一个完整的体系框架,详见表2-4。
表2-4 H.323标准框架协议列表
下面分别简要介绍H.323与H.320不同的H.200系列标准、G系列标准和T.120系列标准部分。
2.3.2 H.200系列标准
本节主要介绍H.323的H.200系列标准的视频H.264编解码标准、呼叫控制H.225.0标准、系统控制H.245标准、多点会议H.323标准、网关控制H.248标准、加密H.235标准。
1.H.264——视频编解码
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT)开发的一个2003年5月通过的新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10部分。
H.323系统是在支持H.320视频编解码方式H.261、H.263基础上,新增H.264编解码格式。H.264采用统一变长编码(VLC)符号编码,高精度、多模式的位移估计,基于4×4块整数变换、分层编码语法等措施,比H.263减少50%左右的码率,较H.263++有更高的压缩性能。H.264码流结构对各种信道的适应能力强,增加了差错恢复能力,能够较好地适应IP和无线网络应用。H.264能满足不同速率、不同分辨率、不同传输场合应用需求,扩大了系统使用范围。2010年3月通过最新的第5版本。
有关视频编解码技术详细介绍,参见第3章。
2.H.225.0——呼叫控制
H.225.0是ITU-T于1996年11月通过的标准,是基于分组的多媒体通信系统的呼叫信令和媒体封装的规程,适用于不同类型网络,通信范围在H.323网关之间。H.225描述了如何管理基于分组网络上的视频、音频、数据和控制信息,使其在H.323设备中提供会话服务。H.225主要包含了呼叫信令Q.931和RAS两部分。2009年12月通过最新的第7版本。
H.225通过在呼叫信令信道上交换H.225的呼叫控制信令信息,实现H.323端点的连接。该呼叫信令信道可以位于两个H.323端点之间,也可以位于端点与GK(Gateway Keeper,网守)之间。
H.225详细定义了Q.931信令信息的使用和支持。在IP网络的TCP 1720端口上,创建一个可靠的TCP呼叫控制信道,完成Q.931呼叫控制信息的初始化,从而实现连接、维持和呼叫分离功能。当网络域中存在一个网关时,H.225呼叫安装信息可能通过直接呼叫信令,也可能通过路由呼叫信令而交换。GK用来决定RAS接入信息交换的选择方式。一旦有了GK,H.225信息可以在端点之间直接进行交换。
RAS是位于端点和GK之间的协议。RAS主要用来实现端点和GK之间的注册、接入控制、带宽转换、状态和拆除等操作。RAS信道主要用来交换RAS信息,该信令信道是早在其他信道建立之前,就已在端点和GK之间开通的。
H.225.0通过RTP/RTCP对下层所有分组网络媒体流分组和同步,H.225.0假定了一个初始信令,是建立在非RTP传输之上的呼叫模型,用于呼叫建立和能力协商(见H.323和H.245),建立一个或多个RTP/RTCP连接。H.225.0包含RTP/RTCP的详细使用方法。
3.H.245——系统控制
H.245是ITU-T于1996年3月通过的标准,它定义了多媒体通信终端之间的控制协议,包括容量交换、逻辑信道控制、流控制消息、通用命令和指示等,主要用于控制信道使用和信道性能。2009年12月通过最新的第15版本。
H.245提供端到端信令,以保证H.323终端的正常通信,根据H.245建议的过程建立视频、音频、数据或控制信息的逻辑信道。逻辑信道通常是单向的,并且在传输的每个方向都是独立的。用来传输数据的逻辑信道可以是双向的,并且通过H.245建议的双向打开逻辑信道过程进行关联。对于每个媒体类型可以发送任意多个逻辑信道,但每个呼叫只能有一个H.245控制信道。除了逻辑信道之外,H.323端点使用两个信令信道进行呼叫控制、完成与GK有关的功能,这些信道所使用的格式必须遵从H.225.0建议。
控制H.323实体操作的是H.245协议消息。H.245消息分为请求、响应、命令和指示四种类型。请求消息要求接收机有动作,包括立即响应;响应消息响应一个请求;命令消息要求规定的动作,但不要求响应;指示消息只起通知的作用,不要求任何动作和响应,通常是指示终端的信息状态。
4.H.248——网关
H.248是ITU-T与IETF共同于2000年6月通过的标准,ITU-T称之为H.248,IETF称之为MeGaCo(以下通称为H.248)。H.248是一种媒体网关控制规程。在分离网关体系中,H.248用于媒体网关控制器(Media Gateway Controller,MGC)与媒体网关(Media Gateway,MG)之间的通信,实现MGC对MG的控制功能。2005年9月通过最新的第3版本。
MGC的功能包括处理与GK间的H.225 RAS消息、No.7信令和H.323信令等。MG的功能包括IP网的端点接口、电路交换网端点接口,处理H.323信令、带有RAS功能的电路交换信令和媒体流。MGC支持H.323和H.225.0的互操作,“中继”网关信令直接连接到MGC,“接入”网关信令到达MG后经过H.248到达MGC。H.248独立于呼叫的控制协议,因此端点不一定是H.323端点。
在H.248定义的连接模型中,包括终端(termination)和关联(context)两个实体。
终端是位于媒体网关中的一个逻辑实体,可以发送、接收媒体和控制流。终端特征通过属性来描述,这些属性被组合成描述符在命令中携带。终端被创建时,媒体网关会为其分配一个唯一标识。
关联是指一个终端集内部的关联关系,当一个关联涉及多个终端时,关联将描述这些终端所组成的拓扑结构以及媒体混合交换的参数。
5.H.235——安全加密
H.235是ITU-T于1996年3月通过的标准,它是H.323体系系列中的有关安全方面的一种标准,主要为基于H.323、H.225.0以及H.245的体系,提供身份认证、数据加密、数据完整性及密钥管理等安全服务,为以H.245作为控制协议的端对端及多点会议的终端提供安全保障。2005年9月通过最新的第4版本。
2.3.3 G系列标准
H.323在继承H.320编码解码方式G.711、G.722、G.728基础上,增加了G.723.1、G.729音频标准。
G.723.1是ITU-T于1996年3月通过的标准,是窄带音频编码模式。它是采用代数码激励线性预测(ACELP)和多脉冲最大似能量化(MP-MLQ)的双速率语音编解码标准,音频传送带宽可为5.3Kbps或6.3Kbps,延迟为67.5ms。在H.320系统中是可选编码标准。2006年5月通过最新的第2版本。
G.729是ITU-T于1996年3月通过的标准,是窄带音频编码模式。它是采用共轭结构的算术码激励线性预测(CS-ACELP)的语音编解码标准,音频传送带宽可为8Kbps,延迟为35ms。在H.320系统中是可选编码标准。2007年1月通过最新的第3版本。
有关音频编解码技术详细介绍,参见第3章。
2.3.4 T.120系列标准
H.323系统沿用T.120标准实现数据应用功能,在数据应用中,直接承载在TCP或UDP上,建立单独的T.120数据信道,根据数据应用内容进行信道带宽调整,并不占用视频信道。当共享或传输高质量图文信息时,可表现出极大的优越性和灵活性。
2.3.5 实时传输和控制协议
1.RTP
RTP(Real-time Transport Protocol,实时传输协议)是用于IP网络上针对多媒体数据流的一种传输协议,它是由IETF的多媒体传输工作小组1996年在RFC 1889中公布的。RTP协议详细说明了在IP网络上传递音频与视频的标准数据包格式。RTP可以在单播或多播的传输情况下工作,常用于流媒体系统(配合RTSP协议)、视频会议系统(配合H.323或SIP),其目的是提供时间信息和实时流同步。但RTP协议通常与RTP控制协议(RTCP)一起使用,在UDP协议上传送,当应用程序开始一个RTP会话时RTP使用偶数号端口,RTCP使用奇数号端口。
RTP本身并不能为有序数据包提供可靠的传送机制,也不提供流量控制或拥塞控制,RTP只传送具有实时属性的数据。RTCP监控服务质量并传送正在进行的会话参与者的相关信息,提供流量控制或拥塞控制服务。RTCP和RTP共同提供流量控制和拥塞控制服务。
2.RTCP
RTCP(Real-time Transport Control Protocol,实时传送控制协议)为RTP提供流量控制和拥塞控制。RTCP执行的主要功能是提供数据发布的质量反馈,其作为RTP传输协议的一部分。在RTP会话期间,各参与者周期性地传送RTCP包,用来监听服务质量和交换会话用户信息,等等。RTCP包中含有已发送数据包数量、丢失数据包数量等统计信息。因此,服务器可以利用这些信息动态地改变传输速率,甚至改变有效载荷类型。RTP和RTCP配合使用,以有效的反馈和最小的开销使传输效率最佳化,因而特别适合传送网上的实时数据。根据用户间的数据传输反馈信息,可以制定流量控制策略;通过会话用户信息交互,可以制定会话控制策略。
总之,H.323协议为不同厂商的多媒体产品间互操作提供了标准依据,解决了点对点、多点间视频会议中诸如呼叫与会话控制、多媒体与带宽管理等问题,目前广泛应用于基于IP协议的视频系统中。