sklearn基本操作代码练习

库目录

一、datasets(数据集)

1.load_boston()

from sklearn import datasets
boston = datasets.load_boston()
#加载并返回波士顿房价数据集(回归)
import pandas as pd
from sklearn import datasets
boston = datasets.load_boston()
boston_df = pd.DataFrame(boston.data,columns = boston.feature_names)
#用DataFrame将数据集格式化
boston_df.head(20)

二、preprocessing(预处理和规范化)

1.StandardScaler()

from sklearn import preprocessing
#预处理和规范化
std = preprocessing.StandardScaler()
#通过去除均值并缩放到单位方差来标准化特征
std.get_params()
#获取此估计量的参数
std.set_params(copy=False)
std.fit(boston.data)
#计算均值和std以用于以后的缩放
std.mean_
#训练集中每个特征的平均值
std.var_
#训练集中每个要素的方差
std.transform(boston.data)
#通过居中和缩放执行标准化

三、linear_model(线性模型)

1.LinearRegression()

from sklearn import linear_model
reg = linear_model.LinearRegression()
#普通最小乘线性回归
reg
reg.fit(boston.data,boston.target)
#拟合线性模型
reg.coef_
#线性回归问题的估计系数
pred = reg.predict(boston.data)
#使用线性模型进行预测
pred[:10]

猜你喜欢

转载自blog.csdn.net/sgsdsdd/article/details/108896558