创建一个机器学习的模型非常简单:
form sklearn,liner_model import LinearRegression # 导入线性回归模型
model = LinearRegression() # 建立线性回归模型
print(model)
- 所有模型提供的接口是:
训练模型,对于监督模型来说为 fit(X,y),对于非监督模型来说为 fit(X)
model.fit()
- 监督模型提供的接口有:
预测新样本
model.predict(X_new)
预测概率,仅针对某些模型有用(如LR)
model.predict_proba(X_new)
计算得分,得分越高,fit效果越好
model.score()
- 非监督模型提供的接口有:
从数据组学到新的“基空间”
model.transform()
将数据按新学到的基进行转换
model.fit_transform()
scikit-learn本身也提供一些数据组,如鸢尾花数据集
from sklearn import datasets
iris = datasets.load_iris()
print(iris.data.shape
from sklearn import svm
clf = svm.LinearSVC()
clf.fit(iris.data, iris.target) #训练集
clf.predict([[5.0, 3.6,1.3, 0.25]]) # 训练后输入新的数据进行预测
clf.coef_ #查看训练好的模型参数