scikit-learn库是一个与机器学习相关的库,是python下强大的机器学习工具包,它提供了完善的机器学习工具箱,包括数据预处理、分类、回归、聚类、预测、模型分析等。
注意:
scikit-learn依赖于numpy、scipy和matplotlib,因此需要提前安装好这几个库,然后再安装scikit-learn。
一、安装scikit-learn库
如前面所说,scikit-learn依赖于numpy、scipy和matplotlib,因此需要提前安装好这几个库,然后再安装scikit-learn。
这里采用最简单的pip安装方法,其他方法可见我的博客“python下载安装第三方库的方法“
由于我之前已经安装过,所以都显示”已安装“的提示。
二、使用scikit-learn库
按照上述安装好scikit-learn库后,就可以使用这个强大的库啦,我将自己实践的部分实例写在这里:
1、使用scikit-learn创建机器学习模型
代码:
from sklearn.linear_model import LinearRegression #导入线性回归模型
model = LinearRegression() #建立先行回归模型
print(model)
输出结果:
2、导入iris数据集并使用该数据训练SVM模型
代码段1:
from sklearn import datasets #导入数据集
iris = datasets.load_iris() #加载数据集
print(iris.data.shape) #查看数据集大小
输出结果:
代码段2:
from sklearn import svm #导入SVM模型
clf = svm.LinearSVC() #建立线性SVM分类器
clf.fit(iris.data,iris.target) #用数据训练模型
clf.predict([[5.0,3.6,1.3,0.25]]) #训练好数据后,输入新的数据进行预测
clf.coef_ #查看训练好模型的参数
输出结果:
完整代码及输出: