聚类分析----模式相似性测度 学习笔记

用于描述各模式间的相似程度。在这里,特征点是矢量的失端。

距离测度(差值测度)

以两个矢量失端的距离作为的距离作为度量的的基础,是两矢量各相应分量之差的函数。

欧式距离

d(x,y)=\left \| x-y \right \|=[\sum_{i=1}^{n}(x_{i}-y_{i})^{2}]^{\frac{1}{2}};其中x,y为两个矢量,d(x,y)为他们的距离(下文同)。

实际中较多地使用欧氏距离,因为只有欧式距离具有平移和旋转不变性。

绝对值距离

d(x,y)=\left \| x-y \right \|=\sum_{i=1}^{n}(x_{i}-y_{i})

切氏距离

d(x,y)=\left \| x-y \right \|=max\left | x_i-y_i \right |

明氏距离

d(x,y)=\left \| x-y \right \|=[\sum_{i=1}^{n}(x_{i}-y_{i})^{m}]^{\frac{1}{m}}

可以看出上面几个分别是m=2,1,∞的特殊情况。

马氏距离

先说下协方差矩阵

以上关于协方差矩阵的内容转自:https://blog.csdn.net/yangleo1987/article/details/52845912

下面说回马氏距离

设xi,xj是矢量集{x1,x2,...,xm}中的两个矢量,他们的马氏距离d定义为:

d^2(x_i,x_j)=(x_i-x_j)^TV^{-1}(x_i-x_j)

式中:

V=\frac{1}{m-1}\sum_{i=1}^{m}(x_i-\bar{x})(x_i-\bar{x})^T

\bar{x}=\frac{1}{m}\sum_{i=1}^{m}x_i

容易证明,马氏距离对一切非奇异线性变换都是不变的,这说明它不受特征量纲的影响,并且是平移不变的;V的含义是一个失良集的样本协方差矩阵。

一般来讲,若x,y是从期望矢量为\mu,协方差矩阵为\sum的母体G中抽取的两个样本,它们间的马氏距离d定义为:

d^2(x,y)=(x-y)^T{\sum}^{-1}(x-y)

相似测度

以两矢量的方向是否相近作为度量的基础

角度相似系数

cos(x,y)=\frac{x^Ty}{\left \| x \right \|\left \| y \right \|}=\frac{x^Ty}{[(x^Tx)(y^Ty)]^{\frac{1}{2}}}

匹配测度

Tanimoto测度

s(x,y)=\frac{a}{a+b+c}=\frac{x^Ty}{x^Tx+y^Tx-x^Ty}

其中a为x,y(1-1)匹配的特征数目,b为(0-1),c为(1-0)

猜你喜欢

转载自blog.csdn.net/aaalswaaa1/article/details/81567011