给一个集合V, V={x|x∈Rn}
, 和一个点u∈Rn
, 依次计算
u
与
V
中各个点的距离, 然后按照从近到远排序, 就可以得到一个
序列A=<x1,x2,...>
- cosine similarity
值域[-1,1], 越大表示越相近. - Euclidean distance
值域 [0,+∞], 越小表示越近.
在二维空间中, 余弦距离是夹角, 欧氏距离是远近. 很明显二者各自得出的序列AA 是不同的.
但要是对uu和VV中的点作归一化呢? 得到的两个AA 是否就相同了呢? 因为在二维空间中容易得到直观的这个推测.
真是的答案是 Yes!
cosine similarity is identical to l2-normalized euclidean distance someway.
For -normalized vectors x,y
we have that the squared Euclidean distance is proportional to the cosine distance,
从式中可以看出, 夹角越大, 欧氏距离的平方就越小, 这就是想要的证明!
参考
原文地址:https://blog.csdn.net/chuchus/article/details/78213957