以KNN为例用sklearn进行数据分析和预测

其他 2019-06-06 20:48:59 阅读次数: 0

准备

相关的库

相关的库包括：

numpy
pandas
sklearn

带入代码如下：

import pandas as pd
import numpy as np
from sklearn.neighbors import KNeighborsClassfier as KNN

数据准备

数据是sklearn的乳腺癌数据。

from skleanr.datasets import load_breast_cancer
data=load_breast_caner()

data主要分为两部分：data和target，把这两部分，设置变量导入DataFrame中可查看基本形状。

X = data.data
y = data.target

sklearn的数据其形式比较固定，data的主要属性有：

data。数据，即变量的值，多行多列

target。目标，即因变量的值，一般是一行

DESCR。描述，可打印出，描述变量、目标

features_names 。X的列名

target_names。Y的列名

filename。数据文件所在位置（一般在\lib\site-packages\sklearn\datasets\data\目录下）

分数据集和测试集：

from sklearn.model_selection import train_test_split
Xtrain,Xtest,Ytrain,Ytest=train_test_split(X, y, test_size=0.3)

注意：

0.3是指30%数据作为测试。每次运行不同，可通过random_state控制
返回的结果固定，不可错

建立模型

clf = KNN(n_neighbors = 5)
clf=clf.fit(Xtrain,Ytrain)

clf就是训练好的模型，可调用接口查看进行预测和评分。常用是predict、score和kneighbors。三者分别用来预测、评分、求最近邻。

猜你喜欢

转载自www.cnblogs.com/heenhui2016/p/10986745.html

以KNN为例用sklearn进行数据分析和预测

用pandas进行数据分析：结合JData ”用户购买时间预测“数据分析实例（五）

用pandas进行数据分析：结合JData ”用户购买时间预测“数据分析实例（三）

用pandas进行数据分析：结合JData ”用户购买时间预测“数据分析实例（二）

用excel进行数据分析——简单图表分析

用Python进行数据分析——相关分析

python数据分析实战：用LSTM模型预测时间序列（以原油价格预测为例）

用python进行数据分析--引言

用python进行数据分析--准备工作

用pandas进行数据分析实战

为什么用python进行数据分析

用python对微信好友进行数据分析

用 Python 进行数据分析 pandas (一)

快速用Python进行数据分析技巧详解

Spark 实践——用Scala和Spark进行数据分析

【转】如何七周成为数据分析师22：用pandas进行数据分析实战

利用DLI进行数据分析和挖掘实践

使用Python和Pandas进行数据分析

大三上人工智能课设，对亚马逊商城评论数据集进行数据分析并可视化（文本特征提取，KNN算法预测评分，进行词关联并绘制云图）

数据分析入门之KNN影片类型和癌症预测

Python进行数据分析探索

利用Python进行数据分析

利用Hive进行数据分析

pandas进行数据分析

《利用Python进行数据分析》

python进行数据分析

4、R进行数据分析

Python进行数据分析（一）

运用Excel进行数据分析

利用pandas进行数据分析

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)