05-网格搜索与k近邻算法中更多超参数

  在上一篇博客中介绍了如何使用网格搜索的方式来寻找机器学习算法中最好的超参数。不过我们网格搜索的过程是使用自己写的 for 循环,在这个过程中,我们发现对于一些超参数而言,它们是存在相互依赖关系的。比如我们在搜索明可夫斯基距离相应的 p 时,只有当 weights=“distance” 时,才有意义。

  为了让我们更加方便地使用网格搜索这样的方式来寻找最佳的超参数,sklearn 封装了一种专门用于网格搜索的方式 Grid Search


下面我们就来具体使用一下。

1. 获取我们所需要的数据集

在这里插入图片描述

2. 定义 Grid Search 所需要的参数

在这里插入图片描述

3. 具体使用

在这里插入图片描述
在这里插入图片描述

4. GridSearch 中还可以传入更多的参数

在这里插入图片描述


更多的距离定义

  除了之前提到的明可夫斯基距离,我们还可以采用其他距离。比如在两个样本之间,我们可以使用统计学上的相似度来定义它们之间的距离,而相似度又有很多定义的方式,如下图所示。
在这里插入图片描述
有兴趣的同学可以查看官方手册


具体代码参考06 网格搜索与k近邻算法中更多的超参数

猜你喜欢

转载自blog.csdn.net/qq_41033011/article/details/108972023