数据分析的三大类型:探索型(图表可视化)、验证性(假设检验)、预测型(机器学习)
探索型数据分析1数据清理相辅相成。--->2根据图形用验证或预测支持验证数据分析及预测型数据分析:该建立怎样地假设,该使用什么特征和模型进行预测。
常用图表:条形图、直方图、饼图、折线图、散点图、箱线图
程序语句:seaborn.barplot(x="day",y="total_bill",data=tips) 条形图(bar)
seaborn.distplot(x) 直方图(hist特殊的条形图)#x是数据,seaborn会自动分配区间
seaborn没有提供饼图功能,绝大部分情况下使用条形图是更好的选择
seaborn.pointplot(x="day",y="tip",data=tips,ci=68)ci表示置信度--》error bar,折线图(line chart)
seaborn.regplot(x="total_bill",y="tip",data=tips) 散点图(scatter diagram)
seaborn.boxplot(x="day",y="total_bill",data=tips),箱线图。
网络数据可视化
网络数据:特殊之处有点和边,工具有Gephi
时空数据:可以在地图上绘制,工具有MapBox、CART
关于Seaborn库的一些补充:Seaborn是matplotlib的补充,而不是替代物。同时它能高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式。掌握seaborn能很大程度帮助我们更高效的观察数据与图表,并且更加深入了解它们。
特点:
- 基于matplotlib aesthetics绘图风格,增加了一些绘图模式
- 增加调色板功能,利用色彩丰富的图像揭示您数据中的模式
- 运用数据子集绘制与比较单变量和双变量分布的功能
- 运用聚类算法可视化矩阵数据
- 灵活运用处理时间序列数据
- 利用网格建立复杂图像集
推荐阅读:知乎账号@知行
关于统计图形的比较和选择:http://www.doc88.com/p-5743942150951.html