Python入门基础（11）——第三方模块

1、大概形式：

数值计算：numpy
数据处理分析：pandas
可视化：matplotlib/seaborn
机器学习：Sklearn/keras
交互：pygame
网络：Selenium等

2、第三方库的安装

先pip install +模块（下载安装模块），然后import + 模块，导入到你的.py模块中就可以了

大致流程如下：

首先，你直接导入模块requests，会报错，因为你本地没有安装这个模块（有的import是可以的，因为Python自带的），然后你就要自己安装一下

注意：有的时候不是没有安装，而是Python版本不一样，因为Python2与Python3相差很大，所以网上档的代码运行时，报错很多家，其中就有模块错误，这不是安装没有安装的问题，而是版本错误

说一下解决方案，主要命令是：pip install requests

首先找到你的Python运行程序，具体位置就是：

也就是找到该文件夹下，如下：

上图中，用蓝色圈勾中的区域就是你的命令要执行的软件，它是用来导入各种模块的。

具体命令如下（要在cmd命令窗口中）：

如上图所示，篮圈中就是所有命令了，先找到你的项目中的pip.exe文件，然后导入requests模块，接下来它就会自动下载你指定的模块了。

然后你再次运行就可以了!!!!!

注意：你要找的pip.exe文件是你运行项目中的文件，而不是PyCharm下的pip.exe文件，也不是Python中的pip.exe文件，这个问题一开始我没有找对，所以一直出错。

当然，除了上面这种方法，还可以自己下载相关模块文件，然后自己安装，不过这种方法就比较麻烦了，还消耗大量的时间（当然，有的时候这种pip方法安装不了，就需要这种笨方法），第二种方法这里就不再详细说了，网上一大堆，自己找吧

3、seaborn可视化

（1）热力图

import numpy as np   #导入numpy模块，同时起个别名：np，这个别名业界也有名，大都默认了
import seaborn as sns  #seaborn可视化第三方库

uniform_data = np.random.rand(10,12)   #随机创建一个10行12列矩阵，每个元素是0-1的实数
ax = sns.heatmap(uniform_data)   #热力图，三维图形用二维表示

输出结果：

（2）散点图

import numpy as np   #导入numpy模块，同时起个别名：np，这个别名业界也有名，大都默认了
import seaborn as sns  #seaborn可视化第三方库

sns.set(color_codes = True)
tips = sns.load_dataset("tips")  #这里tips是一个内置的数据集，两列：tip和total_bill数据
g = sns.lmplot(x = "total_bill",y = "tip",data = tips)  #开始根据数据集画图，设置X/Y轴，然后设置数据集

输出结果：

上面就是根据数据集画出来的，不仅给出了散点图，还给出了最佳拟合回归函数（那个直线），还有一个置信度区间（阴影区域部分，表示拟合回归函数的大致可能范围）——当然一个最大的问题是我不知道这个图片怎么显示出来啊，折腾了半天，也没有搞定

（3）其他语言的可视化库

R语言：SSDcot
JavaScript：D3.JS
Python：seaborn、matplotlib

4、SKLearn（机器学习库）

（1）使用的三大步骤

#第一步：得到数据集，其中train开头的是训练集，而test开头的是测试集，x—输入，y—输出
train_x, train_y, test_x, test_y = getData()

#第二步：
model = somemodel()  #这里的somemodel取决于你用什么模型，如果用SVM，这里就写出SVM()
model.fit(train_x,train_y)  #通过训练集来进行训练，主要步骤就是这一步，耗费大部分时间
predictions = model.predict(test_x)  #模型训练好了以后，要进行测试，给出test_x，会返回一个预测值

#第三步：进行评分
score = score_function(test_y,predictions)

当然，上面给出的是伪代码，不是真正的详细的代码

（2）举一个例子

常用的一个数据集是兰花lris数据集，一共150行数据，每一行4个特征数据，输入是一个150*4的矩阵，输出是一个150*1的数据

Python入门基础（11）——第三方模块

猜你喜欢