摘要:本文首先论述了分布式对象技术的重要概念和基本原理,然后分析了CORBA和Web相结合所带来的技术优势。最后,结合实例,介绍了开发基于CORBA/Web技术的应用系统的步骤和特点。
关键词:Web 分布式对象 CORBA IDL PDMS
1 引言
Internet/Intranet的飞速发展使得World Wide Web应用日益广泛,从而引发了一场Web技术的革命。目前,各种新型的Web应用,如电子出版,电子商务等层出不穷,许多应用系统也纷纷集成了Web浏览器和服务器,Web技术正以日新月异的速度变化着。Web已不再仅仅是超媒体信息的浏览工具,它正逐步成为人们事务处理的通用前端。在分布式环境中,异构性是一个十分明显的特点,一个典型的分布环境包括有大型主机、UNIX工作站和PC机,各种机器所采用的操作系统和网络通信协议也是千差万别。在这样的异构环境下实现信息和软件资源的共享将十分困难,而一个健壮的分布式计算框架将为分布式应用软件的开发带来巨大的好处。由于分布式对象技术,特别是CORBA技术对于提高Web的网络计算能力有着无可比拟的巨大作用,它已开始进入Web领域并投入应用。
2 分布式对象技术
分布式对象技术主要是在分布式异构环境下建立应用系统框架和对象构件,在应用系统框架的支撑下,开发者可以将软件功能包装为更易管理和使用的对象,这些对象可以跨越不同的软硬件平台进行互操作。目前主要的分布式互操作标准有Microsoft的OLE/COM/DCOM标准、Sun公司的Java RMI标准和OMG组织的CORBA标准。下面以CORBA为代表论述分布式对象技术的体系结构,并对三种标准加以比较。
2.1 CORBA体系结构
CORBA的体系结构如图1所示。在该体系结构中主要描述了以下内容:
(1) 接口与IDL语言
接口是CORBA系统中一个非常重要的概念,因为它代表了对象的服务能力,为客户提供了操作对象的唯一方法。简单的说,接口就是一组相关函数的集合,接口中每一个函数都给出了详细的说明,包括函数名、参数个数、参数类型、返回类型以及可能抛出的异常。必须指出的是接口只定义了函数的原型,并没有给出具体的实现,这就留给开发者足够的灵活性来提供他们自己的函数实现。接口是通过一种中性的接口描述语言( IDL,Interface Description Language)来定义的。虽然IDL语言只提供了被ORB操作的对象的概念框架,但是ORB在运行时并不需要IDL的源代码。只要桩例程或运行状态下接口库中的等价信息是可用的,ORB就能通过特定的方式完成其功能。
(2) 桩和构架
桩(Stub)可以看成是实际对象在客户进程中的映像,其中的接口必须是预先定义好的,因此它为客户提供了一种静态的调用方式。与桩相对应的构架(Skeleton)为服务器提供了一种静态的实现方式。IDL编译器翻译描述对象接口的IDL文件,生成对应具体编程语言的IDL桩和IDL构架。桩负责将客户请求进行编码,发送到对象实现端,并对收到的结果进行解释,然后把结果或异常返回给客户。与此相反,构架对客户的请求进行解码,定位目标对象和请求执行的对象方法,激活该方法,然后把结果或异常信息编码返回给客户端。
(3) 动态调用接口和动态构架接口
与桩和构架不同,动态调用接口(DII ,Dynamic Invocation Interface)和动态构架接口(DSI ,Dynamic Skeleton Interface)提供了动态调用的方式和动态实现的方式,它们使得用户可以在事先不知道对象接口信息的情况下通过查询接口库或采取其它手段动态地获得对象接口信息,然后使用ORB核心接口中的DII动态调用方法构造客户请求并发送到对象实现。在对象实现方可以使用DSI的动态分发机制处理客户方的请求。与静态方式相比,动态方式提供了很大的灵活性,但是它的工作效率没有静态方式高。另外,实现系统的接口大多可以预先确定,所以大部分情况下都是采用静态方式。
客户方与服务器方所采用的方式并不一定要一一对应,也就是说,客户方支持静态和动态两种调用方式,服务器方也支持静态和动态两种实现方式,经过组合得到的四种方式都可能出现,例如,客户方使用静态调用方式,而服务器方使用动态构架接口是允许的,反之亦然。
(4) ORB核心和对象适配器
与Unix的实现机制相类似,CORBA规范将那些相对固定的、单一的功能提取出来交由ORB内核实现以保证它的可靠性、高效性与可重用性。作为整个CORBA系统的基础,ORB内核通过屏蔽诸如服务器位置、实现方式、通信协议等具体细节为客户方与服务器方之间的通信提供了透明的传输机制。当前的应用系统存在着各种不同的对象实现方式,例如可执行程序、面向对象的数据库等,他们有不同的定位对象、解释对象、激活对象的方法。因此,如果将现存的所有对象实现的解决方案都包含在ORB内核中,它必将非常庞大、冗余并且难以移植。为了确保ORB内核的高效与可移植性,一个称为对象适配器(OMA)的中间层加入到ORB与对象实现之间。定位目标对象的任务从ORB内核中分离出来交给对象适配器来完成。
2.2 CORBA与RMI和DCOM的比较
RMI直接把分布式对象模型嵌入到Java语言内部,使得Java程序员可以自然地编写分布式程序,不必离开Java环境,或者涉及CORBA IDL以及Java到CORBA的类型转换。然而RMI不遵守CORBA标准,基本上是Java-to-Java技术,它需要客户方程序和服务方程序都用Java编写,难以实现与其它语言编写的对象之间的互操作。
DCOM则是从COM改造过来的。Microsoft把DCOM作为开发Internet和组件的基础,目前已搭载到Windows NT 4.0以上版本和Windows 98中。COM这一技术部分是作为规范,它定义对象实现的二进制标准,用于单机上应用之间的通信,对象实现与使用的语言无关。DCOM是COM的分布式扩展,在DCE RPC之上构造对象的远程过程调用层支持对远程对象的访问。一个DCOM对象(又称为ActiveX对象)是支持一个或多个界面的组件,DCOM界面指预先规定的一组相关函数。DCOM类实现一个或多个界面,由一个又一个128-bit类ID唯一标识。客户程序通过获得指向DCOM对象的界面的指针与该对象交互,通过指针调用其操作。客户程序从不直接访问对象。DCOM对象不支持对象ID,因此,客户程序不能与某个特定的对象发生联系。
3. 分布式对象技术与Web技术的集成
Web 的发展已经历了两个发展阶段。①静态的信息发布阶段。服务器只提供信息的存储和发布功能,用户通过浏览器被动地获取信息,功能单一,缺乏交互性。②动态的信息发布阶段。用户可以通过CGI或JDBC等多种手段与Web服务器,甚至后端数据库直接交互,极大地增强了客户方的可操作性。但是,HTTP协议是一种无状态的协议,很难支持联机处理和系统集成。分布式对象技术与Web 之间并不存在着内在的必然联系,但是这两者相结合后,却产生了诱人的技术魅力。
第一,它可以消除CGI的瓶颈,使客户端能直接调用服务器上的方法。客户端可以利用预编译过的桩(Stub)传递参数或利用CORBA的动态调度服务在运行中产生参数,服务器通过一个预编译的程序直接接受调用。与HTTP/CGI比较起来,客户/服务器的开销非常小。在CGI 中,一个Applet每次调用服务器上的方法必须要启动一个新的进程请求,而CORBA不需要,CGI不能维护客户端调用间的状态,CORBA则可以做到。
第二,CORBA可以提供可伸缩的服务器到服务器的基础结构,对象也可以利用CORBA ORB 进行通信。这样,为了均衡来自客户机上的请求负荷,ORB可以让这些对象运行在多个服务器上,而且,ORB还可以根据各个服务器的负荷情况进行调度。而CGI面对要响应的成百上千个请求,无法将负载分散到多个进程或多个服务器上,这就是CGI运用的瓶颈。
第三,CORBA 可以采用分布式对象结构扩充Java,目前,Java Applet还不能利用远程方法调