机器学习笔记 近似最近邻算法(ANN)

1、ANN算法(approximate nearest neighbor)

最近邻算法通常会牺牲完美的精度来提高速度。这些近似最近邻 (ANN) 算法可能并不总是返回真正的 k 个最近向量。但它们运行高效,可扩展到大型数据集,同时保持良好的性能。

这种算法的优势在于,在许多情况下,近似的最近邻几乎与确切的近邻效果一样好。如果距离测量准确地捕捉了用户的需求,那么距离的微小差异应该无关紧要。

KNN 和 ANN 之间的区别在于,在预测阶段,所有训练点都参与搜索 KNN 算法中的 k 最近邻,但在 ANN 中,此搜索仅从一小部分候选点开始。

近似最近邻搜索 (ANNS) 是数据库、机器学习、多媒体和计算机视觉等许多领域应用中的基本且必不可少的操作。

可以将ANN算法分为三个不同的类别;树、哈希和图形。

这里进行一些快速了解,还有更多的近似最近邻算法,见下面参考资料。

2、HNSW

猜你喜欢

转载自blog.csdn.net/bashendixie5/article/details/128679128