基于RDF的数据集成(3)
作者:佚名; 更新时间:2014-12-05
(六)数据库表之间的多对多关系
在关系模式中,多对多的关联是一种比较复杂的关联关系。往往通过两个关系表的主键字段的交叉关联来达到目的。在基于RDF的数据集成系统的我们使用综合使用(四)和(五)提到的方法表示这种关系。
通过以上的语义映射规则,我们为关系模式和面向对象模式之间的映射定义了完整的映射语法,使用这种映射规则就可以把本地的关系模式顺利的映射为中间层的公共数据模式描述。这种描述使用RDF作为语义描述的载体,没有包含任何关系数据源相关的专有信息,所以很好的实现的异构的屏蔽性。通过这种映射之后,异构的本的数据模式实际已经转换为DBMS无关的中间层元数据模型描述的面向对象的数据模式也即输出模式,至此本地数据模式也转换为一系列的输出模式集。
五、建立全局模式
全局模式的数据是在中间模式的基础上得到的。中间模式的数据实际上是利用RDF的特点将本地模式的数据以类的格式封装起来,中间模式的数据是没有任何方法的纯数据的对象,它不仅具有XML类数据的封装的特点还具有XML类数据不具有的继承的特点,这样的数据更方便于表达纷繁复杂的客观世界,在构建全局模式的数据模型时,可以充分利用包括RDF的三种容器在内的所有工具来组织复杂的数据模型,这是XML不能做到的,是RDF的先进的地方。但是这样得来的数据不能直接被最终用户使用,因为中间模式的数据只是将本地数据以类的要求进行封装的,它只能使用于旧系统的应用要求。最终用户用到的数据需要将中间模式的纯数据对象进行重新组合,包括删除某些类的部分成员或者将某些类的成员合并成新的纯数据对象等等。全局模式就是要按照最终用户的要求把中间模式的数据封装成新的纯数据对象。
对于最终用户要求的数据对象的成员将以文本的格式写在RDF配置文档中间,RDF对语法的严格要求使得RDF文档杜绝了XML文档书写的随意性,文档的规范性使得对应的基于RDF的数据集成的程序也具有可移植性。
在基于RDF的数据集成的程序读取了RDF配置文档后再根据RDF配置文档的要求封装中间模式的数据。
六、总结
网络的发展对于共享数据的要求与数据孤岛之间的矛盾需要用数据集成的方法来解决。本文重点讨论了基于RDF的数据集成的核心思想,将基于RDF的数据集成分成三个层次来讨论,对于每一层的实现方法进行了深入的讨论。基于RDF的数据集成是将数据集成与RDF技术相结合的产物,因此RDF技术的先进性决定了这种集成方法的先进性。
参考文献:
[1]T. Bray, J. Paoli, C. Sperberg-McQueen, and E. Maler, “Extensible Markup Language (XML) 1.0 (second ed.),” W3C Recommendation, Oct. 2000.
[2]J. Cowan and R. Tobin, “XML Information Set,” W3C Recommendation, Oct. 2001.
[3]H. Thompson, D. Beech, M. Maloney, and N. Mendelsohn,“XML Schema Part1:Structures,”W3C Recommentation,May 2001.
[4]D. Chamberlin, D. Florescu,J.Robie, J. Simeon, and M. Stefanescu, “XQuery 1.0: An XML Query Language,”June 2001.
[5]O. Lassila and R. Swick, “Resource Description Framework (RDF) Model and Syntax Specification,” W3C Recommentation, Feb.1999.
[6]G. Karvounarakis, V. Christophides, D. Plexousakis, and S.Alexaki, “Querying RDF Descriptions for Community Web Portals,” Proc.French Nat'l Database Conf., Oct. 2001. :9090/RDF/RQL/.
上一篇:教育数字视频的应用现状及制作原则
热门论文