ID3算法:倾向于选择分支多的选项作结点
首先是离散型的数据,按公式求增益,选最大的那个选项作为分裂结点
关于求Infor_A(D)式子的解释,第一个5/14是youth,后面的2/5是yes,3/5是no
然后是连续型的数据
左边有七个年龄,右边是六个邻值均值,然后六个均值各切一刀计增益,选最高增益的即可
补充:
PS:样本有缺失项的情况未深入研究
ID3算法:倾向于选择分支多的选项作结点
首先是离散型的数据,按公式求增益,选最大的那个选项作为分裂结点
关于求Infor_A(D)式子的解释,第一个5/14是youth,后面的2/5是yes,3/5是no
然后是连续型的数据
左边有七个年龄,右边是六个邻值均值,然后六个均值各切一刀计增益,选最高增益的即可
补充:
PS:样本有缺失项的情况未深入研究