KNN算法总结

KNN算法也称为K近邻算法,是一个非常简单的分类算法。
原理:为了判断未知样本所属的类别,以所有已知的类别的实例作为参照,计算未知样本与所有已知样本的距离,并从中选择未知样本与已知样本的距离最近的K个实例样本,根据少数服从多数的投票原则,让未知实例归类为K个最邻近样本中最多数的类别。(一般采用的是欧式距离计算方法)
算法缺点:
1.算法复杂度较高(需要比较所有已知实例与要分类的实例)
2.当其样本分布不平衡时,比如其中一类样本过大(实例数量 过多)占主导的时候,新的未知实例容易被归类为这个主导 样本,因为这类样本实例的数量过大,但这个新的未知实例 实际并没有接近目标样本
3.处理不了高维数据

发布了8 篇原创文章 · 获赞 0 · 访问量 87

猜你喜欢

转载自blog.csdn.net/qq_43596996/article/details/104583452