网络视频技术与应用实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.5 基于H.324M移动视频通信标准框架

20世纪80年代,ITU提出了未来公用陆地移动通信系统(PLMN)的第三代移动通信概念。其初衷是希望制定一套全球统一的移动通信网络体系结构,但由于当时第二代移动通信系统规模已经极为庞大,为实现现有不同体制的网络兼容,ITU提出IMT-2000核心网络“家族”概念,1996年改称为IMT-2000,1999年11月ITU-R TG8/1会议确定了5个IMT-2000无线技术接口技术的框架性标准,如表2-5所示。

目前,WCDMA、CDMA2000和中国的TD-SCDMA成为三大主流制式,与前两代移动通信系统相比,其主要特征可以提供移动多媒体业务,提供更大的系统容量和更好的通信质量,能够实现全球无缝漫游,同时能很好地兼容第二代系统。其具体指标是:室外高速移动环境接入速率为144Kbps,室外慢速移动环境接入速率为384Kbps,室内环境接入速率为2Mbps。

表2-5 IMT-2000无线技术接口标准

IMT-2000核心频带为230MHz(1885~2025MHz和2110~2200MHz),2005年5月WRC还通过了IMT-2000的扩展频谱规划(806~969MHz、1710~1885MHz和2500~2690MHz),进一步确定3G未来发展方向和空间。IMT-2000后续标准化主要集中在“IMT-2000增强”和“IMT-2000”系统研究上,目标是采用更新技术达到更高性能指标。

3GPP(3rd Generation Partnership Project)是指WCDMA无线接口和基于GSM MAP核心网的第三代移动通信技术规范,由欧洲ETSI发起,日本ARIB、TTC、韩国TTA、美国T1和中国CWTS参加的第三代伙伴计划负责制定。3GPP制定的标准版本多、更新快,目前成形的标准版本分为R99/R4/R5三个阶段,其中R99最为成熟、稳定。中国TD-SCDMA在2001年3月正式纳入3GPP标准,其标准体系、网络架构和演进路线与WCDMA基本一致。

3GPP2(3rd Generation Partnership Project2)是指IS-41核心网、CDMA2000无线接口的第三代移动通信标准,由美国国家协会ANSI发起,日本ARIB、TTC、韩国TTA和中国CWTS参加的另一个第三代伙伴计划负责制定。

不同国家,由于其移动运营商和设备制造商的已有基础和发展战略不同,因此移动视频市场的发展过程也不相同,如图2-8所示。

日本和韩国发展进程:阶段1→阶段2→阶段4,即日本和韩国的3G网络发展迅速。

美国的发展进程:阶段1→阶段3→阶段4,即美国的3G网络发展相对较慢,而手机终端的发展相对较快。

在未来几年,移动视频业务将得到很大的发展,各种移动视频业务将会随着网络和终端的不断发展而逐步实现。

目前,WCDMA、CDMA2000和中国的TD-SCDMA三大主流网络均可向用户提供电路承载方式的语音、视频业务,而基于分组承载方式的视频通信业务尚不成熟,本节重点讨论基于H.324M的电路承载视频通信系统。

图2-8 移动视频发展历程

2.5.1 标准组成

1.H.324M

20世纪90年代末期,移动通信开始飞速发展。随着技术的完善,在移动网上已经具备了开展视频通信业务的可能,在此背景下,H.324M标准逐渐走到了前台。目前,日本的DoCoMo已经建立了H.324M视频通信网,并且与传统的H.320及H.323网实现了互联互通。

H.324M标准是指ITU-T H.324标准的“移动部分”扩展部分,主要是附录C和附录H所规定的与无线接入相关的内容,增强了多路复用器在无线网络环境下抗数据通信错误的能力,以及附加命令和控制流程。这些为移动应用而扩充的功能就是H.324M。

讲到H.324M标准,必然要涉及H.324标准,这里简单介绍一下H.324,它是制定了如何通过同步V.34 MODEM来进行基于POTS(Plain Old Telephone Systems)的低比特率可视电话国际标准通信。其通用部分定义的控制协议采用H.245,多路复用采用H.223,视频编码协议采用H.261或H.263,数据协议采用T.120,音频编码协议采用G.723.1。目前固定电话的可视电话就是通过H.324标准实现的。为了在无线或移动产业扩展这种标准,在H.324附件C和附录H,以及H.223附件A、B、C中都分别做了定义。

3GPP采纳H.324M建议作为3G网络传统视频电话的一个标准,并在TS 26.110和TS 26.111中做了补充,从而形成了3G-324M的标准。它针对语音、视频和多路复用操作提出了一些要求:要求AMR成为音频编码的可选编码标准之一;强制规定ITU H.263为视频编码标准;添加H.223附件B用来保护复用数据。

因为H.324、H.324M、3G-324M之间的衍生关系,使得3G终端与PSTN多媒体终端之间的H.324视频通话实现互通。也就是说,通过3G手机拨打固定可视电话也可以实现视频通话。

H.324M与H.324协议的主要区别在于H.324M采用了不同的音频与视频编解码方式,即增加了AMR((Adaptive Multi-Rate)和MPEG-4编解码算法,复用/解复用采用了H.223协议而不是H.225协议。H.245为H.223中移动扩展部分提供了附加的命令和控制流程。这些为移动应用而扩充的功能统称为H.324M标准,遵循该标准的终端称为H.324M终端。H.324M视频终端体系结构如图2-9所示。

图2-9 H.324M视频终端体系结构

2.3G-324M

支持UMTS(Universal Mobile Telecommunications System,通用移动通信系统)技术的3GPP最初只是将3G-324M定义为1999年12月发布的Release'99的一部分。2002年8月3GPP批准了3G-324M在CDMA2000的使用。2003年TD-SCDMA成为3GPP标准,它同样采纳了3G-324M,并作为正式的3G标准开始在中国推广。

在移动通信中,WCDMA标准R99版本规定,实时视频通信类业务主要基于核心网电路交换方式承载,流媒体类业务主要基于核心网分组交换方式承载。3GPP采纳H.324M协议作为电路交换视频通信的标准,制定了3G-324M框架性协议,它可以在无线电路交换网络上实现实时多媒体服务,使视频、音频、控制信号等在同一个64Kbps带宽的物理链路上传输。采用3G-324M作为其移动视频传送标准的原因是,它提供了用户期望的接收质量。3GPP 3G-324M标准包括两个TS(Technical spaces),TS 26.112用于CS呼叫建立,TS 26.111定义3G-324M初始化和操作过程。3GPP2对应的标准为“3GPP2 C.S0042 for Circuit- Switched Video Conferencing Services”,符合该规定的终端称为3G-324M终端。

3G-324M标准在技术上与H.324M非常相似,但是它指定H.263作为视频编码强制基本标准,而把MPEG-4作为推荐标准。AMR是音频编码强制标准,G.723.1作为可选的老编码标准,如图2-10所示。H.223制定了多路音频和视频信号在单个移动通信信道的多路复用应用标准,H.245制定了在各个阶段的消息控制交换标准。但是,易出错网络的高效传输方法在3G-324M标准中制定。另外,Level 2(由H.223附录B制定)被制定为强制的多路复用协议层,它可以提供增强的容错控制。

图2-10 3G-324M协议框架

3G-324M是一个无地址的协议,它不包括基带呼叫建立,该协议的呼叫建立在以下规范中定义:

3GPP TS 24.008:移动射频接口第三层规范。

3GPP TS 27.001:针对移动站的一般性终端适配功能。

3GPP TS 29.007:公共陆地移动网络(PLMN)和集成服务数字网络(ISDN)或公用交换电话网络(PSTN)之间互连的一般要求。

3GPP TS 23.108:移动射频接口第三层规范核心网络协议。

由于3G-324M依附在通信双方之间建立的一条信道上,因此它不需要H.323的寻址机制。但需要通过不同网络网关实现3G-324M、H.320、H.323和SIP之间的互操作性。

3G-324M的主要子协议和过程有:①误码恢复服务;②H.223复接/分接协议;③ITU-T H.245呼叫控制;④用于视频的H.263和用于音频的自适应多速率(AMR),MPEG-4为可选编解码器。

2.5.2 控制协议

1.误码恢复

在移动会话式多媒体通信中,误码恢复对误码检测和在线隐蔽非常重要。H.223为这样的服务提供附录A、B、C和D。附录A和B将光处理定义在中等BER水平。这些附录是3GPP强制制定的,目前已被供应商们广泛采用。另外,MPEG-4视频提供用于误码恢复的工具,因此能够减小由误码引起的视频质量下降。这些解决方案不会减少如前向纠错(FEC)或自动重传请求(ARQ)这样的错误,但它们能减少对解码视频质量的损伤。

2.H.245——系统控制

H.324M和3G-324M都通过H.245协议进行系统控制,H.245协议过程主要包括主从决定过程、能力交换过程、打开逻辑通道过程、关闭逻辑通道过程、模式请求过程、H.223复用表过程、回路延时过程。

(1)主从决定过程:其目的是解决冲突(MCU级联、资源争用)。当在一个呼叫中,两个终端同时初始化一个相似事件,而资源只对其中之一可用时,就会有冲突发生,如打开一个逻辑通道。为了解决这种冲突,其中一个终端应该定义成主终端,而另一个定义成从终端。

(2)能力交换过程:其目的是使对端节点了解本端的能力。接收能力表示了终端接收和处理输入信息流的能力。如果没有接收能力这一项则表明终端不能接收。发送能力表示终端发送信息流的能力。如果没有发送能力这一项则表明终端没有给接收器提供一个模式的优先选择权,并不代表不能发送。

(3)打开逻辑通道过程:通过获得对端的媒体传输地址(RTP端口)和媒体控制传输地址(RTCP端口),并把本端的RTP端口和RTCP端口及媒体流的能力信息(类型、带宽、编码格式等)告诉对端来打开逻辑通道。

(4)关闭逻辑通道过程:关闭已打开的逻辑通道。

(5)模式请求过程:用于在逻辑通道建立后,因媒体格式发生变化,而通知对方以新的媒体模式重新建立逻辑通道。例如,语音逻辑通道建立后,检测到传真单音,要求对方切换到传真模式。

(6)H.223复用表过程:用于H.223复用。

(7)回路延时过程:主要用于判断对端是否工作和估计到达延时。

H.245作为H.324M和3G-324M多媒体通信的控制方法,具有各种通信控制功能,在无误码的环境中,它能使用信道内请求-响应消息实现可靠的控制。

H.245提供主从判断、功能交换、逻辑信道管理、复用表管理、模式改变请求及各种命令与指示等功能。为了提供这些功能,H.245定义了需要使用的消息和处理这些消息的过程。H.245使用抽象语法符号1(ASN.1)定义能够有效提供可读性和可扩展性的每个消息参数。为了将这些ASN.1消息编码成二进制数据,H.245采用了压缩编码规则(PE),因此它能使带宽实现高效的消息传送。当通信双方之间完成复用层同步后,第一个建立的逻辑信道(信道0)是H.245呼叫控制。H.245具有CCRL和NSRP,它们能够确保H.245信道的高度可靠性。

3.H.223复用协议

复用协议的基本功能是将多个媒体流交织组成单个流,媒体流可以包括视频、语音、用户数据和控制信号(H.245)。复用后的单一媒体流再通过一个传输通道发送出去。H.324M和3G-324M选用了ITU-T H.223移动扩展第二层作为它的复用协议。

H.324M和3G-324M协议的初始化前,通信双方之间最先建立H.223复用协议,在通信双方之间建立电路交换信道后开始初始化,复用进程必须在通信双方之间取得同步,在打开第一个逻辑信道(信道0)时建立呼叫控制(H.245)。

H.223多路复用和信号分离层提供多路逻辑信道到单个信道的合并,可以同时支持分时多路复用和包多路复用两种模式;由于无线环境数据传输的高位错误率,H.223定义了不同操作模式,用于处理传输出错。

Level 0(H.223基本协议),提供同步和比特填充支持,支持媒体、控制信息和数据包的混合传输;不提供任何容错功能。

Level 1(H.223附录A),使用的同步机制可以有效增强易出错信道的传输性能,提高了mux-PDU的同步传输性能,但在冲突发生时会发生某些出错风险。

Level 2(H.223附录B),是Level 1的进一步增强,提供更稳定的MUX-PDU数据帧。

Level 3(H.223附录C),提供了最稳定的传输方案,但在3G-324M中没有被采用。

H.223适配层提供逻辑信道的QoS。

AL1用于传输数据和H.245控制消息,不提供出错检测和恢复能力。

AL2提供8位CRC校验及可选顺序编码控制,适用于音频数据传输。

AL3提供16位CRC校验和可选顺序编码,传输变长的AL SDUs,提供可选的重传过程,适用于视频数据传输。

2.5.3 媒体协议

1.视频编码

H.324M采用H.263和MPEG-4为视频编码标准,3G-324M指定H.263为强制性基准协议(附录中的扩展标准除外),而把MPEG-4制定为推荐视频编码标准。H.263作为老的编码标准仍然应用于现有的H.323系统中,因而H.324M和3G-324M保留它可以提供系统兼容性。MPEG-4比H.263基准协议拥有更高的灵活性,它提供了更先进的错误检测和纠错方法。

这两种编码集一般均采用QCIF输入图像格式。MPEG-4采用一系列工具集提高了容错性。它采用的方法包括:数据分区、可反置变长编码(RVLC,Reversible Variable Length Codes)、再同步标识和报头扩展编码(Header Extension Codes,HEC)。

数据分区方法通过标识符分别提供离散余弦(DCT)系数和移动矢量参数,这样可以避免某组数据的出错影响到另外一组数据的解码。例如,如果在某个给定的宏块中检测到DCT系数错误,我们仍然可以隐藏DCT系数错误,采用正确的移动矢量信息重新创建宏块。这样,与解码过程中采用前面相邻数据帧的正确宏块替换出错宏块的方法相比,该方法可以提供更高的视频图像解码质量。

RVLC方法允许对特定的数据块从前端(前向)或者末端(反向)开始解码。这种方法提高了对出错数据集的修复概率。

再同步标识符是插入比特流中的一些代码,它可以帮助解码器对解码进程进行重新同步。

HEC支持更高效的解码进程再同步,其扩展的再同步标识符还包含了时间信息。

2.语音编码

ITU-T标准对语音编码没有强制性要求,只有IMT-2000语音服务应用强制性要求AMR(Adaptive Multi-Rate)编码,用于支持H.324M和3G-324M设备。G.723.1是3GPP推荐的可选编码标准,它可以提供兼容H.323等标准。

AMR语音编码的最高处理速率是12.2Kbps,取决于不同的基站距离、信号干扰和流量情况,AMR的实际传输速率范围是4.75~12.2Kbps。AMR还支持柔化噪声生成(CNG,Comfort Noise Generation)和非连续传输模式(DTX,Discontinuous Transmission)。AMR还可以根据不同的实际情况动态调整处理速率和错误控制,在当前的信道环境下提供最佳的语音质量。

AMR编码还支持非对等错误检测和预防(UED/UEP,Unequal Error Detection and Protection)。这种方法基于可判断的数据相关性对比特流进行分类,如果在最相关的数据中检测到错误,就可以对AMR数据帧直接进行解码,并隐藏数据错误。

3.数据通信协议

T.120是H.324M和3G-324M数据会议应用推荐的数据通信协议。但是,当前还没有制定任何强制性协议,因而它也只是一种可选标准。