分类表/主题词表作为传统的知识组织工具与本体具有相似性,即它们都是以提高检索效率和知识共享为目的;都用来描述特定领域的学科知识,都可以用作特定学科的知识组织工具;两者都包含词(概念、类)及词(概念、类)间关系;两者都具有等级结构,并通过等级关系及词(概念、类)间关系将词(概念、类)组织起来。
然而Ontology与这些传统知识组织工具有着本质的区别。Ontology中概念之间的关系的表达比分类表/主题表等工具要广而且深。本体更强调对具体事物属性和关系的描述,强调构建领域概念的形式化模型,重视术语体系的模型化、明晰化、形式化和概念模型的共享性。
分类表、主题词表的词间关系精确程度不高,无法揭示更深更广的语义关系。并且它们没有自身的知识表示语言、无法实现形式化编码,无法支持知识资源的知识标注和知识检索。一个完善的Ontology能够提出结构的主体概念的关系,包括superclass\Psubclass\Pinstance(超类\亚类飞实例)关系、property value(特征值)、时间关系以及依赖于所用的表达语言的关系等。通常一个Ontology包含的不止是关系,与分类表、主题词相比这些关系被正式地定义并不模糊。Ontology用基于描述逻辑的知识表示语言对概念体系(类、关系、函数、公理、实例)进行形式化描述,能支持本体标引工具对资源进行语义标注,支持以知识网络的方式展示知识结构。因此,Ontology对概念的揭示程度远远高于分类表飞主题词表。
本体( Ontology)在数字图书馆知识组织中的作用
1.规范描述知识间的语义关系运用本体方法对数字图书馆的知识进行组织,可以减少概念和术语上的歧义,概念间的关系可以被描述得更加广泛、详细、深入和全面,通过对概念添加属性值,对属性与属性之间再添加映射关系,一些在正规词表中不能描述的语义关系就可以清晰的描述出来。本体描述为数字图书馆提供了一个统一框架或规范模型,使得来自不同背景,持不同观点和目的的人们之间的理解和交流成为可能,并保持语义上的一致性。
2.实现知识重用和共享本体概念体现的是共同认可的知识。这如同美国哲学家托马斯·库恩提出的被某一科学共同体所公认的"范式"。可以说,本体概念体系是一种公约。由于本体反映的是相关领域中公认的概念,所以数字图书馆通过本体对相关知识领域的知识进行规范化描述和识别,可以达成领域内关于知识和概念及概念关系之间的共识,实现各学科领域本体之间(如法学本体、经济学本体等)的共享和复用。
3.实现知识检索在本体的支撑下实现基于语义的知识检索,这是本体的重要应用之o知识检索是知识组织的逆过程。实现基于概念语义的知识检索,就必须以本体作为组织领域知识的语义模型,实现对资源的语义标注,形成机器可理解的语义元数据,以基于本体的知识语言标示、检索领域知识。只有以基于本体的知识组织模式为基础以各领域本体的概念模型作为资源元数据的规范描述标准,才能真正实现数图书馆中基于语义的知识检索。