原型聚类prototype-based clustering假设聚类结构能通过一组原型刻画。
常见的原型聚类有:
- k均值算法k-means
- 学习向量量化算法Learning Vector Quantization:LVQ
- 高斯混合聚类Mixture-of-Gaussian
一、k-means算法
1.k-means
给定样本集$D={X_1,X_2,...,X_N}$,假设一个划分为$C={C_1,C_2,...,C_K}$,定义该划分的平方误差为:
$err=\sum_{k=1}^K \sum_{x=1,X_i \in C_k} ||X_i - u_k||_2^2$,其中$u_k = \frac{1}{|C_k|} \sum_{X_i \in C_k}X_i$是簇$C_k$的均值向量。