【学习笔记】统计学入门(1/7)——基本概念

来源:http://study.163.com/course/courseMain.htm?courseId=1005232026

索引——

  • 基本概念
  • 连续变量的统计描述
  • 分类变量的统计描述
  • 正太分布
  • 二项分布
  • 参数估计与可信区间
  • 假设检验

一、基本概念
 

1、个体、变量与变异

     个体:统计分析中的观察对象或者观察单位     

     变量:对研究对象的某项目或研究指标进行观察或测量,这种观察项目或者研究指标即为变量

     变异:同个个体的变量值的差异

2、变量类型

     连续变量:取值范围为区间,它可以在区间取值,一般有度量单位。如:身高,年龄,体重,金额等

     ps:一些特殊变量不能取任意值,但扔可近似当连续变量处理。如:班级学生总数,配件消耗量

     离散型变量:取值范围为有限搁置或者一个数列构成的,表示分类情况的离散型变量又称为分类变量

    (根据类别的有序性,分为——)

     有序分类变量:如:收入级别、售后服务满意度(满意、一般、不满意)

     无序分类变量:如:血型、民族

3、数据间类型的转换::丢弃一部分信息量的前提下,可以将变量向信息量减少的方向加以转换

     3.1 连续数据转为有序分类数据

          如:年龄(原:1,2,3...24,25,26...  转:“少年,青年,老年”或者 “青年,中老年”)

                 客户贡献度->人为划分为若干等级

    3.2 有序分类数据转为两分类数据(不建议)

          如:售后满意度->按照某个级别一分为二

4、总体、样本和随机抽样

     总体:分为有限总体和无限总体。有限~如:广州市成年男子数量,无限~如:糖尿病病人数量,生产线上某产品的质量

     样本:大范围研究对象中随机抽出部分个体进行观察测量,即为样本。

     随机抽样:随机不等于“随便”,随机的本质——每个个体入选抽样是不可知的,但其入选可能性是确切可知的,关键在于样本对于总体而言是具有代表性的(多数情况为等概率,如:随机摇到骰子每个点数的可能性是一样的)

     统计量(statistic):对样本进行描述的指标/变量。

     总体参数(parameter):描述总体的指标/变量,如:总体中某个指标所有个体变量值的平均数。

     抽样误差:由随机抽样造成样本统计量与总体指标之间的差异。

5、概率、频率和小概率事件

     随机事件:随机现象某个可能的观察结果如:扔硬币(朝上/朝下)

     频率:随机事件出现的频次或比例

     概率:取值范围于0到1之间,表现可能性的大小

     小概率事件:事件发生的概率小于或等于0.05,即为小概率事件

6、统计研究的步骤

     设计——收集——整理——分析

     设计:

         

     收集:控制质量,保证数据的准确性

     整理:占80%的工作量,可用软件工具

     分析:了解数据情况,力求精确、直观、全面;

               呈现方式分为俩种——统计图,统计报表;

               统计推断:从样本外推到总体。如:配件的日平均用量

猜你喜欢

转载自blog.csdn.net/Yi_jia_yi/article/details/81046922