聚类路线图（算法选择） - 代码天地

聚类路线图（算法选择）

编程语言 2018-11-21 00:53:42 阅读次数: 0

一般实验选择sklearn包。需要从两个方面看。数据量和样本分布。建议看下面两个图和链接进行粗选。

一般实验选择sklearn包。需要从两个方面看。数据量和样本分布。建议看下面两个图和链接进行粗选。

链接：http://sklearn.apachecn.org/cn/0.19.0/modules/clustering.html#different-linkage-type-ward-complete-and-average-linkage

Method name（方法名称）	Parameters（参数）	Scalability（可扩展性）	Usecase（使用场景）	Geometry (metric used)（几何图形（公制使用））扫描二维码关注公众号，回复： 4164304 查看本文章
K-Means（K-均值）	number of clusters（聚类形成的簇的个数）	非常大的 n_samples, 中等的 n_clusters 使用 MiniBatch code（MiniBatch 代码）	通用, 均匀的 cluster size（簇大小）, flat geometry（平面几何）, 不是太多的 clusters（簇）	Distances between points（点之间的距离）
Affinity propagation	damping（阻尼）, sample preference（样本偏好）	Not scalable with n_samples（n_samples 不可扩展）	Many clusters, uneven cluster size, non-flat geometry（许多簇，不均匀的簇大小，非平面几何）	Graph distance (e.g. nearest-neighbor graph)（图形距离（例如，最近邻图））
Mean-shift	bandwidth（带宽）	Not scalable with n_samples （不可扩展的 n_samples）	Many clusters, uneven cluster size, non-flat geometry（许多簇，不均匀的簇大小，非平面几何）	Distances between points（点之间的距离）
Spectral clustering	number of clusters（簇的个数）	中等的 n_samples, 小的 n_clusters	Few clusters, even cluster size, non-flat geometry（几个簇，均匀的簇大小，非平面几何）	Graph distance (e.g. nearest-neighbor graph)（图形距离（例如最近邻图））
Ward hierarchical clustering	number of clusters（簇的个数）	大的 n_samples 和 n_clusters	Many clusters, possibly connectivity constraints（很多的簇，可能连接限制）	Distances between points（点之间的距离）
Agglomerative clustering	number of clusters（簇的个数）, linkage type（链接类型）, distance（距离）	大的 n_samples 和 n_clusters	Many clusters, possibly connectivity constraints, non Euclidean distances（很多簇，可能连接限制，非欧几里得距离）	Any pairwise distance（任意成对距离）
DBSCAN	neighborhood size（neighborhood 的大小）	非常大的 n_samples, 中等的 n_clusters	Non-flat geometry, uneven cluster sizes（非平面几何，不均匀的簇大小）	Distances between nearest points（最近点之间的距离）
Gaussian mixtures（高斯混合）	many（很多）	Not scalable（不可扩展）	Flat geometry, good for density estimation（平面几何，适用于密度估计）	Mahalanobis distances to centers（Mahalanobis 与中心的距离）
Birch	branching factor（分支因子）, threshold（阈值）, optional global clusterer（可选全局簇）.	大的 n_clusters 和 n_samples	Large dataset, outlier removal, data reduction.（大数据集，异常值去除，数据简化）	Euclidean distance between points（点之间的欧式距离）

猜你喜欢

转载自blog.csdn.net/u012863603/article/details/84302316

聚类路线图（算法选择）

算法学习路线图

技术路线图

JavaScript路线图

学习路线图

路线图

python路线图

java路线图

人工智能学习路线图（机构选择篇）

随机路线图算法(Probabilistic Roadmap, PRM)-Python实现

2020年算法工程师技术路线图

Hadoop的学习路线图

ios学习路线图

JAVA技术路线图

Nodejs学习路线图

java学习路线图

Mahout学习路线图

Hadoop学习路线图

IT职业发展路线图

Hive学习路线图

JavaerTravel行车路线图

javaweb学习路线图

Android 学习路线图

Python学习路线图

机器学习路线图

生成螺旋路线图

Java的学习路线图

前端成长路线图

javascript学习路线图

前端开发路线图

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)