分享几道ID3的习题,如有问题,望指出,感谢,笔芯。
练习一
练习一
答:
(1)计算决策属性的熵
令汽车保险数据集为S,其中有6个样本,目标属性风险类有2个值{C1=L,C2=H},2个样本的类标号取值为L,4个样本的类标号取值为H。
C1=L在所有样本S中出现的概率为2/6,
C2=H在所有样本S中出现的概率为4/6,
则此数据集的S的熵为:
分享几道ID3的习题,如有问题,望指出,感谢,笔芯。
练习一
答:
(1)计算决策属性的熵
令汽车保险数据集为S,其中有6个样本,目标属性风险类有2个值{C1=L,C2=H},2个样本的类标号取值为L,4个样本的类标号取值为H。
C1=L在所有样本S中出现的概率为2/6,
C2=H在所有样本S中出现的概率为4/6,
则此数据集的S的熵为: