Python数据分析整理
成都找了份实习工作,之前本来是打算先熟悉下SPSS的使用,但是公司要分析的基本是百万左右的数据,于是边学习边整理下资料吧。
所有代码基本都来自网上,我都会注明学习整理的出处,可能由于一些库版本的原因会进行稍加修改,所有代码都是在我的版本下可以跑通的,有不了解的地方可以在下方留言。
重新把《机器学习实战》里面的东西过一遍,代码和数据基本都是书上的,同时也加了些自己的代码。
Python 3.7.6
sklearn 0.0
pandas 1.0.5
matplotlib 3.2.2
numpy 1.18.5
代码基本目标是实现功能,如需了解具体的统计背景,可在网上搜索哈。
SPSS整理目录
整理目录
回归
一元线性回归
https://blog.csdn.net/weixin_44255182/article/details/108684546
多元线性回归
https://blog.csdn.net/weixin_44255182/article/details/108687764
K近邻算法
改进约会网站配对效果
https://blog.csdn.net/weixin_44255182/article/details/108700521
决策树
决策树分类实现
https://blog.csdn.net/weixin_44255182/article/details/108748933
决策树绘制
https://blog.csdn.net/weixin_44255182/article/details/108755891
决策树的保存和调用
https://blog.csdn.net/weixin_44255182/article/details/108762161
K均值聚类
其他小应用
操作word文档
https://blog.csdn.net/weixin_44255182/article/details/108722059
非标准正态分布下概率密度有关计算
https://blog.csdn.net/weixin_44255182/article/details/108785628