【K-means算法】{0} —— K-means算法的简单介绍 - 代码天地

【K-means算法】{0} —— K-means算法的简单介绍

其他 2020-04-23 09:18:46 阅读次数: 0

K-means算法是一种聚类算法。

分类：事先知道数据的类别，使用已知的数据训练出分类器，再对未分类的数据进行分类，属于监督学习。
聚类：事先不知道数据的类别，根据特征的相似度对数据进行聚类，属于非监督学习。

K-means算法的基本思路：

随机选取K个初始点为质心（类别）
遍历每一条数据，计算其与K个质心的距离
选择与之距离最近的质心作为该数据所属的类别
每个簇的质心更新为该簇所有点的平均值
重复2、3、4步骤，直到代价函数收敛到最小值

上述过程的伪代码表示如下:

创建k个点作为起始质心(经常是随机选择)
当任意一个点的簇分配结果发生改变时:
	对数据集中的每个数据点:
		对每个质心:
			计算质心与数据点之间的距离
		将数据点分配到距其最近的簇
	对每一个簇，计算簇中所有点的均值并将均值作为质心

K-means的代价函数（又称畸变函数 Distortion function）为：

SSE（误差平方和）

对误差取了平方，因此更加重视那些远离中心的点。

其中μ_c(i)代表与x^(i)最近的聚类中心点。我们的优化目标是找出使得代价函数最小的

迭代的过程一定会是每一次迭代都在减小代价函数，不然便是出现了错误。

K-Means的主要优点有:

容易实现。
原理简单，收敛速度快。
处理大数据集较为高效。
空间复杂度为O(N)，时间复杂度为O(IKN) —— N为样本点个数，K为中心点个数，I为迭代次数
需要调参的只有簇数K。

K-Means的主要缺点有:

对初值敏感，对于不同的初始值，可能会导致不同结果。
在簇的平均值被定义的情况下才能使用，这对于处理符号属性的数据不适用。
对于不是凸的数据集比较难收敛
对于不平衡的数据，聚类效果不佳。
对噪音和异常点比较敏感。

参考资料：吴恩达机器学习教程、《机器学习实战》

Giyn

发布了75 篇原创文章 · 获赞 267 · 访问量 5206

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_45961774/article/details/105649223

【Bisecting K-means算法】{0} —— Bisecting K-means算法的简单介绍

【K-means算法】{0} —— K-means算法的简单介绍

k-means 算法介绍

k-means算法

K-means 算法

算法 - k-means算法

k-means算法的简单实现

K-means算法简介

K-means算法实现

k-means算法详解

K-Means算法优化

K-Means算法原理

K-means算法的缺点

k-means算法之

K-Means算法实例

KNN 与k-means 算法

算法强化 —— K-means

K-means聚类算法原理简单介绍

【机器学习】k-means算法介绍及简单实现

K-Means算法（K-Means Clustering）

05 聚类算法 - K-Means、二分K-Means、K-Means 、K-Means||、Canopy、Mini Batch K-Means算法

K-means算法与K-means++算法的异同

K-means聚类算法的三种改进(K-means++,ISODATA,Kernel K-means)介绍与对比

k-Means算法，聚类算法

聚类算法：K-means算法

K-means算法和KNN算法

机器学习---算法---k-means算法

FCM算法与K-means 算法

数据挖掘算法——K-means算法

机器学习——聚类算法之K-means与K-means++,K-meansⅡ

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)