判定树归纳算法描述

ID3版本:

算法:Generate_decision_tree 由给定的训练数据产生一棵判定树。
输入:训练样本samples,由离散值属性表示;候选属性的集合attribute_list。
输出:一棵判定树。
方法:
     (1)创建节点N;
     (2)if samples 都在同一分类C中,then
     (3)返回N作为叶子节点,以分类C标记;
     (4)if attribute_list 为空,then
     (5)返回N为叶子节点,标记为samples中最普通的类;//多数表决
     (6)选择attribute_list中具有最高信息增益的属性test_attribute;
     (7)标记节点N为test_attribute;
     (8)for each test_attribute中的已知值Ai//划分sample
     (9)由节点N长出一个条件为test_attribute = Ai的分支;
     (10)设Si是samples中的test_attribute = Ai的样本的集合;
     (11)if Si为空 then 加上一个树叶,标志samples中的最普通的分类;
     (12)else 加上一个由Generate_decision_tree(Si,attribute_list-test_attribute)返回的节点;

猜你喜欢

转载自marvinibm.iteye.com/blog/1410851