传统的权值计算是基于统计学原理来进行的,而从上述的指标体系来看,进行评价的指标只有部分是可明确量化,而对于大部分指标,很难直接用统计学的方法确定这些指标的具体判断值,只能给出定性的模糊语言进行评估和判断。同时,上述的指标体系又是多层次的,因此,纳税服务知识体系的评价必须要考虑这种模糊性和层次性。基于上述原因,本文提出了运用多级模糊评价法构建基于纳税服务知识系统的模糊综合评价模型,其主要步骤如下:
(1)确定纳税服务知识评价等级的向量评语集。评语集是由评价者对评价对象可能做出的各种评价结果组成的集合。
(2)将指标集按其属性及业务特征进行归类。
(3)确定指标权重。对上述指标的各个因素进行权重设定是必不可少的一个环节,其可以先通过德尔菲(Delphi)方法设定,也可以使用神经网络学习算法来确定。
(4)计算评价矩阵。由于指标可分为定量和定性指标两大类,分别采用两种不同的方法来确定评价矩阵R。定量指标的评价是指建立指标与数量对应的关系,使所确定的数量能反映出系统实施水平在该指标上的水平高低,可以采用直线法和折线法来确定指标评价值。对于定性指标的单因素评价,由于定性指标的评价较难以定量化,通常采用模糊统计的方法。
(5)按照评语等级对应的加权向量,可以求出每一级综合评价集的评价值,并以此确定属于等级的评语。
3其它权值分析
在综合研究的基础上,本文认为整个指标体系的内容应该包括三大要素:知识,主题词以及检索结果。与之相对的评价体系权值也分成知识权值,主题词权值以及检索结果动态权值。知识的指标和权值计算本文已有介绍,下面将简单介绍主题词权值和检索结果动态权值。
3.1主题词权值
主题词也是按照主题词的评价体系进行评分,主要依据有主题词的上下位关系、主题词的行业特性、主题词的使用频度等。当用户进行多主题词检索时在整合主题词的次序综合计算出主题词的权重,并结合知识的权值,以此对检索结果进行合理化排序。
3.2检索结果动态权值
该权值主要应用在知识检索的时候能把最有价值的知识优先排序。一个主题词在标题中出现与在知识内容中出现,其意义是不同的,在用该主题词进行检索时,标题中包含该主题词的知识的权值要高于内容中包含主题词的知识的权值。此外出现的次数越多,权值也就越高,在检索结果排序就靠前。
4结束语
本文对知识评价指标及权值计算方法进行了较为详细的描述,阐述了主题词权值及检索结果动态权值的概念与意义。该方法已经应用于某市的12366纳税服务体系的纳税服务行业知识库系统,效果良好。本文研究内容是北京市高成长企业自主创新科技专项课题《中国地税行业业务基础支撑体系及应用》中的一部分。在今后的研究中将在现有的研究应用基础上继续完善知识评价体系,不断地按照纳税服务行业知识库的实际应用并参照其他行业知识库的使用情况,完善知识评价体系指标及分值计算算法。