分类器是数据挖掘中对样本进行分类的方法的统称,包含决策树,逻辑回归,朴素贝叶斯,神经网络等
分类器的构造和实施大体会经过以下几个步骤:
-
选定样本(包含正样本和负样本),将所有样本分成训练样本和测试样本两部分。
-
在训练样本上执行分类器算法,生成分类模型。
-
在测试样本上执行分类模型,生成预测结果。
-
根据预测结果,计算必要的评估指标,评估分类模型的性能。
几种基本的分类器:
决策树分类器;选择树分类器;证据分类器---选择树分类器与决策树分类器比较相近,但是前者在选择节点处可以考虑多种情况,将多种因素放入一个选择节点中,而决策树分类器一个节点一次最多只能选取一个属性作为考虑对象。
证据分类器就是通过检查在一个给定属性上某个特定的结果发生的可能性来对数据进行分类。比如一个正在打着一把伞的人,有70%是女性,30%是男性。