首先初始化k个点作为质心,遍历数据集,把每一个数据点分配到距离最近的质心,把这个质心下的所有点的均值作为新的质心,迭代更新。
度量聚类效果的指标:SSE( sum of squared error)误差平方和
改进算法:二分-k-均值算法(克服k-均值局部收敛)
二分-k-均值 聚类算法
将所有点看成一个簇,利用2均值聚类将簇一分为二,选择SSE最大的簇进行划分,直到达到用户指定的分类数。
首先初始化k个点作为质心,遍历数据集,把每一个数据点分配到距离最近的质心,把这个质心下的所有点的均值作为新的质心,迭代更新。
度量聚类效果的指标:SSE( sum of squared error)误差平方和
改进算法:二分-k-均值算法(克服k-均值局部收敛)
二分-k-均值 聚类算法
将所有点看成一个簇,利用2均值聚类将簇一分为二,选择SSE最大的簇进行划分,直到达到用户指定的分类数。