数据的离散程度衡量

集中趋势衡量指标

  均值,中位数,众数。

  集中趋势无法完全表现数据的特征,均值,众数相等的数据,也存在无限的分布可能。

  需要结合数据的离散趋势,进一步挖掘数据特征。 

离散趋势衡量指标:

  极差-range:极大值-极小值,其考虑的只是极端的现象,没有考虑到中间其他的数据项,受数据异常点影响较大,不能真实反映数据的离散程度。

 四分位距:Q3-Q1,其规避了异常数据对离散程度的判断,但是并未体现数据整体特征。

 方差-Variance:使用均值作为参照系,考虑了数据集中所有数据相对均值的偏离情况,使用平方的方式进行求和取平均,避免正负数的相互抵消,是常用的衡量数据离散的统计量。

偏度和峰度:

猜你喜欢

转载自www.cnblogs.com/CrazyJioJio/p/11883802.html