了解中位数、众数和平均数

中位数、众数和平均数都是描述一组数据的集中趋势的特征数.它们又代表反映了不同的样本数据特征.
中位数是将数据按大小排列后位于中间的数据.如果数据的个数为偶数,就取中间两个的平均数作为中位数.中位数是利用样本数据中排在中间数据的信息,是样本数据所占频率的分界线,它不受少数几个端点值的影响,容易计算,这是它的优点;但在某些情况下,它对极端值不敏感也成为缺点,因为这些极端值有时是不能忽略的.
  众数是样本数据中频率分布的最大值所对应的样本数据(即出现次数最多的那个数据).众数体现了样本数据的最大集中点,所以它只能表达样本数据中很少的一部分信息,对其他数据信息的忽视,使得它无法客观地反映总体特征.
  平均数是一组样本数据的平均值.它与每一个样本数据都有关,任何一个样本数据的改变都会引起平均数的改变,越"离群"的数据,对于平均数的影响越大.与中位数、众数相比,平均数可以代表样本数据的更多信息.但平均数受数据中的极端值的影响较大,使它在估计总体时的可靠性降低.当样本数据质量较差时,使用平均数描述数据的中心位置可能与实际情况产生较大差异.
  如果样本的平均数大于中位数,说明数据中存在许多较大的极端值.反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本的中位数和平均数,会帮助我们更好地了解样本数据中极端数据的信息,以便做出决策.


猜你喜欢

转载自yinter.iteye.com/blog/553524