KNN基础代码

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/lee__7/article/details/102772013

库 sklearn

库下的工具:
datasets,model_selection,neighbors

K近邻代码思路:
有个数据集----对数据分割----调用KNN算法

iris = datasets.load_iris()

导入数据集
数据集权重:开源数据集,重要数据集之一
数据集特点:还有3个类别,所以可分类
数据集描述链接:https://archive.ics.uci.edu/ml/datasets/Iris/

x=iris.data
y=iris.target
print(x,y)

y表示类别:3个值。所以适合分类问题
iris有150个已知数据,所以 len ( x ) , len ( y ) 都是150

在这里插入图片描述

x_train , x_test , y_train , y_test = train_test_split ( x , y , random_state = 2003 )

分割数据集
x 是已知数据,一共 150 个,分成训练集112个 和 测试集38个
y 同理

clf = KNeighborsClassifier(n_neighbors=3)

扫描二维码关注公众号,回复: 7650887 查看本文章

调用k近邻算法,邻居为3

clf.fit(x_train,y_train)

猜你喜欢

转载自blog.csdn.net/lee__7/article/details/102772013
kNN