基于决策树的农民技术服务管理模型(2)
作者:佚名; 更新时间:2014-11-08
(2)一棵决策树能对一个例子做出正确类别判断所需的期望信息比特为
如果以属性作为决策树的根,具有个值,它将分成v个子集,假设中含有pf个正例和,zf个反例,那么子集,所需的期望信息是l(pi,ni),以属性为根所需的期望信息是
因此,以属性A为根的信息增益是Gain(A)=l(p,?)一()(3)该算法选择使Gain(A)最大的属性作为分枝属性,这种方法使生成的决策树平均深度较小,从而有较快的分类速度,但这个标准易偏向于取值较多的属性,为此,本文采用信息增益率的选择方法。增益率定义为Gain—ratio=Gain(A)/1V(A)(4)其中,1V(AJ=()是关于属性A的取值的信息度量。利用增益率选取特征能真正实现先选取信息量大的属性作为判定属性,得出的结果比信息增益更令人满意。
2.2分类规则提取
本文采用的规则提取方法是:【1)从根节点到每个叶节点分别为一条规则。(2)沿每一路径中检验属性的合取作为规则的前提部分,而每一路径的叶节点为规则的结论部分。
3模型的提出
由于农业数据的大量、多维、动态、不完整、不确定等特性,就农业生产而言,在大量的数据中发现其内部所特有的规律难度较大。但是,目前多数农民合作社的业务覆盖范围较小,只涉及到农业产业化经营链中的部分内容,区域经济特色鲜明,其业务数据具有明显的区域性。针对此类数据进行数据挖掘具有必要性和可行性,据此发现的隐含规则具备较高的可信度。
本文针对农民专业合作社的组织结构和业务流程,以提高合作社技术服务管理能力为目标,通过深入分析其业务范围和数据特点,将数据挖掘技术应用于生产经营过程中,建立基于决策树的农民专业合作社技术服务管理模型,如图1所示。
上一篇:坚持以人为本提高领导干部素质
下一篇:论如何做好独立学院就业指导工作