解题:
因为题中假设弱分类器为决策树,可采用CART二叉分类树。
1、初始化数据权值分布:
D = (w11, w12, ..., w110) = (0.1,0.1, ..., 0.1)
w1i =0.1 ,i = 1,2,....,10
2、计算各特征的基尼系数(为计算方便,就取深度为1 的树):
根据基尼系数的计算公式:
求得:
gini(D,潜力=2)的基尼系数最小,所以第一个选潜力等于2 和非2 为划分点。
3、计算误差率,分类器的权重,更新的权重:
根据上面的划分可以知道3,6,8被误分类
则计算如下:
4、如此循环往复的重复步骤2,3,直到你的分类器上的误差为0 ,或者低于你的阈值的时候,就可以停止了。
ps:计算的正确性,我也不知道我计算正确没有,不过应该正确的