基于决策树的农民技术服务管理模型(4)
作者:佚名; 更新时间:2014-11-08
本文使用式(1)~式(4)分别计算以下属性的熵:
合作社社员等级的熵为,(=_(89/213)1b(89/213)一(124/213)lb(124/213)O984那么,参加培训频率划分样本集后所得的信息增益是
E(经常):0.908
E(一般)=O.907
E(参加培训频率)=0.908Gain(参加培训频率)=一(参加培训频率)=0.076Gainratio(参加培训频率)=Gain(参加培训频率)(参加培训频率)=O.084
同理,计算得到接受现场指导频率、入社年限、是否入股的信息增益为
Gain—ratio(接受现场指导频率)0.022
Gainratio(入社年限)=0.007
Gainratio(是否入股):0.002
根据以上数据得出Gain—ratio(参加培训频率)>Gain—ratio(接受现场指导频率)>Gain—ratio(是否入股)>Gain—ratio(入社年限)为了清楚地挖掘出有价值的信息,信捷职称论文写作发表网,选择信息增益率最大的属性(参加培训频率)作为决策树的根节点属性创建分枝,该属性有“经常”和“一般”2个值,各产生一个分支,并将训练样例排列在适当的分支之下,重复上述过程,在各个分支处再选取信息增益最大的属性(除去已选作节点的属性),如此递归,直到这棵树能完美分类训练样例,或所有的属性都已被使用,最终生成的决策树模型如图2所示。
上一篇:坚持以人为本提高领导干部素质
下一篇:论如何做好独立学院就业指导工作