【sklearn】LinearRegression使用

其他 2021-04-01 11:32:09 阅读次数: 0

1 参数

sklearn 的 LinearRegression 存在一个参数可以在训练前进行标准化

from sklearn.linear_model import LinearRegression
model = LinearRegression(normalize=True)

文档介绍
normalizebool, default=False

This parameter is ignored when fit_intercept is set to False. If True, the regressors X will be normalized before regression by subtracting the mean and dividing by the l2-norm. If you wish to standardize, please use StandardScaler before calling fit on an estimator with normalize=False.

有意思的是 normalized 和 standardize 都是标准化，减去均值除 l2 范数

2 系数

训练完成的线性回归模型，其系数可以代表该特征的重要性

sorted(dict(zip(continuous_feature_names, model.coef_)).items(), key=lambda x:x[1], reverse=True)

也可以绘图

model = LinearRegression().fit(train_X, train_y_ln)
print('intercept:'+ str(model.intercept_))
sns.barplot(abs(model.coef_), continuous_feature_names)

3 检查模型

训练完模型，要比对真实和预测的差距，确定模型是否可行

subsample_index = np.random.randint(low=0, high=len(train_y), size=50)
plt.scatter(train_X['v_9'][subsample_index], train_y[subsample_index], color='black')
plt.scatter(train_X['v_9'][subsample_index], model.predict(train_X.loc[subsample_index]), color='blue')
plt.xlabel('v_9')
plt.ylabel('price')
plt.legend(['True Price','Predicted Price'],loc='upper right')
print('The predicted price is obvious different from true price')
plt.show()

如果偏差较多，说明模型有问题
可能是标签的问题，若标签是长尾分布，则不符合模型的假设
需要调整为正态分布

train_y_ln = np.log(train_y + 1)

再训练，就好很多了

猜你喜欢

转载自blog.csdn.net/qq_40860934/article/details/114288682

【sklearn】LinearRegression使用

sklearn LinearRegression

Sklearn——用Sklearn实现线性回归(LinearRegression)

sklearn系列学习--线性回归LinearRegression

from sklearn.linear_model import LinearRegression

sklearn常用的API参数解析：sklearn.linear_model.LinearRegression

LinearRegression

sklearn.linear_model之LinearRegression核心源码解析

线性回归函数LinearRegression、随机梯度下降函数SGDRegre使用，波士顿房价预测，sklearn.metrics.mean_squared_error(y_true, y_pred)

机器学习sklearn模块（线性回归LinearRegression模型、岭回归Ridge模型、基于LinearRegression的多项式回归模型）

python_sklearn机器学习算法系列之LinearRegression线性回归

Scikit-Learn（sklearn）中的LinearRegression（线性回归）对波士顿房价进行预测

最小二乘法线性回归、sklearn.linear_model.LinearRegression

编程作业1.1——sklearn机器学习算法系列之LinearRegression线性回归

使用sklearn

sklearn 的使用

LinearRegression,RidgeCV,LassoCV,ElasticNetCV各自使用场景

sklearn Pipeline使用

sklearn svm基本使用

sklearn使用简单入门

sklearn使用小记GridSearchCV

sklearn中XGBoost的使用

sklearn的PCA使用

keras与sklearn的结合使用

sklearn.cluster使用

sklearn ROC曲线使用

使用sklearn - 特征工程

sklearn的KNN算法的使用

sklearn的学习使用

sklearn PCA的使用

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)