学校开的选修课的复习笔记(内容大部分来自学校的PPT)
需要一定统计学知识
1.绘图基础语法与常用参数
基础绘图流程:
(1).创建画布与子图
plt.figure #创建一个空白画布,可以指定画布大小 像素
figure.add_subject #创建并选中子图,可以指定子图的行数、列数,与选中图像编号
plt.title #添加标题 可以指定标题名称、位置、颜色、字体
plt.xlabel #添加x轴名称,可以指定位置、颜色、字体大小等
plt.ylabel #添加y轴名称,可以指定位置、颜色、字体大小等
plt.xlim #指定x轴范围 只能确定一个数值区间,且无法使用字符串标识
plt.ylim #指定y轴范围 只能确定一个数值区间,且无法使用字符串标识
plt.xticks #x轴刻度的数目与取值
plt.yticks #y轴刻度的数目与取值
plt.legend #当前图形的图例,可以指定图例大小,位置,标签
plt.savagif #保存绘制的图片 可以指定分辨率、边缘颜色等参数
plt.show #在本机显示图形
(2).rc参数
pyplot使用rc配置文件来自定义图形的各种默认属性,被称为rc配置或rc参数
线条常用的rc参数名称、解释与取值
lines.linewidth #线条宽度 取0-10之间的数值,默认为1.5
lines.linestyle #线条样式: "-" "--" "-." ":" 默认为"-"
lines.marker #线条上的形状 可取"o" "D" "h" "." ","等等 默认为None
lines.markersize #点的大小 取0-10之间的数值 默认为1
注意:
(1).默认的pyplot不支持中文字符的显示,因此需要设置font.sans-serif,同时还要更改axes.unicode_minus
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.pyplot.rcParams['axes.unicode_minus']=False
2.分析特征间的关系
(1).散点图
散点图又称为散点分布图,是以一个特征为横坐标,另一个特征为纵坐标,利用坐标点的分布形态反应也证件的统计关系的一种图形。
matplotlib.pyplot.scatter(x,y,s=None,c=None,marker=None,alpha=None,**kwargs)
x,y 接收array,表示x轴y轴对应的数据 s指点的大小,默认为None c指点颜色,默认为None
marker为绘制点的类型,alpha表示点的透明度
(2).折线图
折线图是一种将数据点连接起来的图形,可以看作散点图按照x轴坐标顺序连接起来的图形。
matplotlib.pyplot.plot(*args)
x,y x和y轴对应的数据 color指线条的颜色 linestyle 线条类型 marker指绘制点的类型 alpha指点的透明度
3.分析特征内部数据分布与分散状况
(1).直方图
直方图又称质量分布图,是统计报告图的一种,由一系列高度不等的纵向条纹或线段表示数据分布情况,一般用横轴表示数据所属类别,纵轴表示数量或者占比。
matplotlib.pyplot.bar(left,height,width=0.8,bottom=None,hold=None,data=None,**kwargs)
left array,表示x轴数据
height array,表示y轴数据
width 接收0-1的float,直方图宽度,默认为0.8
color 直方图颜色
(2).饼图
饼图是将各项的大小与各项总和的比例显示在一张饼中,以饼的大小来确定每一项的占比。
matplotlib.pyplot.pie(x,explode=None,labels=None,colors=None,autopct=None,pctdistance=0.6,
shadow=False,labeldistance=1.1,startangle=None,radius=None,...)
plt.pie(x=plt_1996,labels=label,explode=[0,0],autopct='%3.1f%%',shadow=True,startangle=90)
x array 用于绘制pie的参数
explode array 制定项离饼图圆心为n个半径
labels 每一项的名称
color 饼图颜色
autopct 数值的显示方式
pctdistance 每一项比例和距离饼图n个半径 默认为0.6
labeldistance 指定每一项的比例和距离饼图圆心n和半径
radius 饼图半径,默认为1
(3).箱线图
箱线图也称箱须图,其绘制需使用常用统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同特征值的时候,更可表现其分散程度差异。
matplotlib.pyplot.boxplot(x,notch=None,sym=None,
vert=None,whis=None,positions=None,widths=None,
patch_artist=None,meanline=None,labels=None,....)
x 绘制箱线图的数据 positions 图形位置
notch 箱体是否有缺口 widths 每个箱体的宽度
sym 异常点形状 labels 箱线图的标签
vert 图像纵向或横向 meanline 是否显示均值线
4.matplotlib保存图像
matplotlib.pyplot.savefig()
注意:要在pyplot.show()前使用,否则保存图片为空白