集中趋势 (central tendency)
- 一组数据向其中心值靠拢的倾向和程度
- 测度集中趋势就是寻找数据水平的代表值或中心值
- 不同类型的数据用不同的集中趋势测度值
- 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据
集中趋势的度量
分类数据:众数(mode)
1. 众数
- 一组数据中出现次数最多的变量值
- 适合于数据量较多时使用
- 不受极端值的影响
- 一组数据可能没有众数或有几个众数
- 主要用于分类数据,也可用于顺序数据和数值型数据
2. 众数 (不惟一性)
- 无众数
原始数据: 10 5 9 12 6 8 - 一个众数
原始数据: 6 5 9 8 5 5 - 多于一个众数
原始数据: 25 28 28 36 42 42
顺序数据:中位数和分位数
1. 中位数 (median)
- 排序后处于中间位置上的值
- 不受极端值的影响
- 主要用于顺序数据,也可用数值型数据,但不能用于分类数据
- 各变量值与中位数的离差绝对值之和最小
2. 四分位数 (quartile)
- 排序后处于25%和75%位置上的值
- 不受极端值的影响
数值型数据:平均数
平均数(mean)
- 也称为均值
- 集中趋势的最常用测度值
- 一组数据的均衡点所在
- 体现了数据的必然性特征
- 易受极端值的影响
- 有简单平均数和加权平均数之分
- 根据总体数据计算的,称为平均数;根据样本数据计算的,称为样本平均数。
1. 简单平均数 (Simple mean)
2. 加权平均数 (Weighted mean)
3. 几何平均数 (geometric mean)
- n 个变量值乘积的 n 次方根
- 适用于对比率数据的平均
- 主要用于计算平均增长率
众数、中位数和平均数的比较
1. 众数、中位数和平均数的关系
2. 众数、中位数、平均数的特点和应用
(1)众数
- 不受极端值影响
- 具有不惟一性
- 数据分布偏斜程度较大且有明显峰值时应用
(2)中位数
- 不受极端值影响
- 数据分布偏斜程度较大时应用
(3)平均数
- 易受极端值影响
- 数学性质优良
- 数据对称分布或接近对称分布时应用