本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。
一、算法原理
MiniBatchKMeans
是KMeans
算法的一个变种,它使用小批量(mini-batches)来减少计算时间,而这多个批次仍然尝试优化相同的目标函数。小批量是输入数据的子集,在每次训练迭代中随机抽样。这些小批量大大减少了收敛到局部解所需的计算量。 与其他降低Kmeans
收敛时间的算法不同,小批量 Kmeans
产生的结果通常只比标准算法略差。
该算法在两个步骤之间进行迭代 。在第一步, 是从数据集中随机抽取样本,形成一个小批量。然后将它们分配到最近的质心。 在第二步,质心被更新。与Kmeans
不同, 该变种算法是基于每个样本。对于小批量中的每个样本,通过取样本的流平均值和分配给该质心的所有先前样本来更新分配的质心。 这具有随时间