3.2 MPEG-4及其在VOD业务中的应用
视频点播是近年发展起来的基于多媒体技术的交互式服务方式,VOD是以数字压缩技术为基础、网络与多媒体技术相结合的交互电视系统。VOD业务是指用户可以从自己的终端(机顶盒、普通模拟电视机)上申请所需信息,提供服务的部门按用户需要提供有关信息。VOD业务主要有影视选播、电视购物、远程教学、远程医疗、电子图书馆和交互式电子游戏等。目前流行的VOD系统主要采用MPEG-2编码标准。这种标准的画面质量好,压缩比高。然而MPEG-2标准在VOD业务的应用中也暴露出其不足方面:基于宏块和帧的编码方式限制了对内容的交互操作、压缩效率仍不理想、窄带网上的传输质量受到限制和对媒体的兼容能力有待提高等。因此VOD业务的发展急需一种以多媒体应用为目标的新一代编码标准。
MPEG-4基于对象编码的技术特点和它可实现的功能,在VOD业务中有很大的应用潜力。同采用MPEG-2标准的VOD业务相比,基于MPEG-4的VOD业务具有以下特点:
(1)图像主观质量更好由于采用基于视频对象的编码方式,编码时可以根据人眼的视觉特性,区分不同视频对象的主次关系,合理安排压缩比。与现存的标准相比,这种编码方式容易获得更好的图像主观质量。
(2)交互性更完善
MPEG-4VOD用户突破了传统上基于帧进行操作的限制,可以根据各自的需求,针对帧中的某一个视频对象,进行平移、旋转、缩放、剪帖和检索等交互式操作,使交互性能有了质的飞跃。这种基于对象的交互操作,使用户能根据某一具体画面(如某种植物)查询相关内容,或是查询画面中某一物质对象的其它资料(即VOD电子图书馆业务)。用户还可放大自己存放在医院的X光照片,取出自己关心的那部分画面仔细观察(即VOD远程医疗业务)等等。
(3)灵活性更大
VOD业务部门可以根据不同地域的具体条件、使用不同的传输网络(如HDSL、ADSL、HFC和FTTH/FTTC等),开展VOD业务。VOD用户也可以对音/视频的质量、实时性和接入网方式等作自由选择。
(4)多媒体兼容能力更强
MPEG-4不但支持自然音频、视频,而且支持自然和合成的混合音频、视频。在VOD电子游戏中,用户可以利用自然的音频和视频创作动画和合成声音。在VOD影视节目点播中,用户可以在画面上选择叠加自己母语的字幕,或者叠加其它文字信息(如股票行情等)。
对于采用MPEG-4标准的VOD系统,还可以利用MPEG-4多个并行数据流编码技术提供的多视点编码功能,开展虚拟现实游戏、三维电影和多视角演示等其它新业务。也可以利用音频编码的TTS功能,提高远程教学的质量。
此外,尚待解决的主要技术问题有:
(1)为了适应MPEG-规定的5kbps~4Mbps视频速率范围,为用户提供高质量乃至DVD质量的图像,目前的图像压缩技术仍需进一步提高。
(2)为了实现基于视频对象的交互操作,需要解决如何定义、描述、划分和分离视频对象
的问题。
MPEG-4标准具有比现存标准更好的主观画面质量、更完善的交互性能、更强的媒体兼容能力和更大的灵活性。将MPEG-4用于VOD业务,一方面可以发挥它在多媒体应用方面的优势,另一方面也可以提高VOD业务的质量,拓宽VOD业务的范围。随着数据压缩技术的不断发展,MPEG-4必将成为VOD系统编解码技术的核心标准
3.3 MPEG-4在无线/移动多媒体通信中的应用
ISO/IEC正在进行标准化的MPEG-4是一种可用于通信、广播和计算机等诸多领域的通用多媒体编码方式 ,1997年10月已公布了草案,正式标准(第1版)于1998年12月颁布。MPEG-1和MPEG-2是以CD-ROM和DVD等存储媒体以及广播系统的高质量、高比特率(2Mbps以上)为对象的音频和视频编码方式,已完成标准化。
MPEG-4则尤为重视压缩效率,是一种能用于低比特率(64kbps以下)的编码方式,对传输误差有较强的耐受性。
另一方面,ITU-T还推进模拟电话线路所用多媒体通信终端的标准方式(H-324)与无线/移动通信相对应, 准备将之作为H 324AnnexC,加以标准化。具体说来,就是对H- 324中所用H 223(在一个分组内对声音和图像进行多路复用方式)的抗误差性进行分级强化,分别作为H 223AnnexA、AnnexB和AnnexC进行标准化(下文中AnnexA、B、C统称Annex)。目前,就多媒体通信所必需的多路复用方式而言,除了MPEG-4外,ISO还能够采用H 223和MPEG 2TS(传输流)等已有的多路复用方式。因此,为了在无线/移动环境中实现多媒体通信,有必要将具有抗误差性的ISO标准MPEG 4编码方式与ITU-T标准H 223Annex多路复用方式 结合起来。
图1多媒体通信网络范例
图1给出了包含无线/移动通信系统的多媒体通信网络范例。本例中,便携式终端通过各种网络实现电视电话、图像监视和图像浏览等功能。把便携式终端和电视摄像装置获取的图像存储在服务话、图像监视和图像浏览等功能。把便携式终端和电视摄像装置获取的图像存储在服务器中,并建立数据库,利用因特网进行信息分配,从而使其他便携式终端用户也能够看到这些图像。图像传输是多媒体通信的核心,采用何种图像编码方式是构筑多媒体网络的关键。特别是在用于要求实时性的电视电话和广播业场合,不能在收发方之间进行信息重发和到达确认等特殊控制,因此MPEG-4图像编码方式是比较理想的,它无需这种控制,且抗误差性较强。对应于不同的网络,多媒体信息传输时所需的多路复用方式有很多种。例如,因特网等分组网通常用不同的分组分别传送声音和图像,并通过内藏于各媒体的时间标记,各自取得同步的H 225多路复用方式或MPEG2TS多路复用方式。在使用模拟电话线路电视电话的场合,在同一分组内对声音和图像进行多路复用的H.223方式已经成为ITU-T标准。另外,在无线/移动环境中,具有抗误差性的H 223Annex多路复用方式也是行之有效的。
因此,在构筑多媒体网络时,可以采用抗传输误差性能较强的MPEG-4作为图像编码方式,而多路复用则采用与各网络相适应的方式。这样,当通过不同的网络进行图像传输时,只需调换多路复用方式就可以了。
* 刘占平,董士海 MPEG-4标准及相关进展 中国图象图形学报<1999.06>
* 岳云 MPEG-4在无线/移动多媒体通信中的应用 电信快报<1999.09>
* 唐冬,郑善贤 MPEG-4及其在VOD业务中的应用 电信快报<1999.09>
* 翁南钐,蔡德钧,容太平 基于内容的视频编码技术 通信技术<1999.03>
* 夏天,陈磊,余兆明 MPEG-4的基于内容的视频编码技术 电子工程师<1999.10>
* Rob Koenen Overview of the MPEG-4 Standard Stockholm - July 1997
* MPEG -4 FAQs ISO/IEC JTC1/SC29/WG11 N MPEG 97/ July 1997
* Rob Koenen MPEG-4 Overview - (Melbourne Version) October 1999/Melbourne