【R假设检验】基本概念与基本思想

【R假设检验】基本概念与基本思想


著名的物理学家爱德华·特勒曾经引用过:

“A fact is a simple statement that everyone believes. It is innocent, unless found guilty. A hypothesis is a novel suggestion that no one wants to believe. It is guilty, until found effective.”

假设检验的应用在数据科学中占主导地位,它是简化和结构的必备之选。就像犯罪小说的故事一样,基于数据的假设检验,将从一个新颖的建议引向一个有效的命题。

在数理统计分析中,只能由估计量估计总体的参数,尽管能获得总体参数的无偏估计,总体的参数始终是不可知的。只能通过统计检验,由统计量推断总体的参数。
在统计推断过程中,需要对参数提出一定的假设,然后对提出的假设进行假设检验。

基本概念

在这里插入图片描述
假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。

基本思想

1. 运用了反证法的思想
先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设H0是否正确,首先假定该假设H0正确,然后根据样本对假设H0做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设H0,否则应接受假设H0
2. 又区别于纯数学中的反证法
这里的接受与拒绝,并不是通过形式逻辑中的绝对矛盾来判断,而是基于人们实践中广泛采用的一个原则:小概率事件在一次观察中可以认为基本上不会发生。

步骤

在这里插入图片描述

注意问题

1、作假设检验之前,应注意资料本身是否有可比性。
2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。
3、根据资料类型和特点选用正确的假设检验方法。
4、根据专业及经验确定是选用单侧检验还是双侧检验。
5、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。

假设检验的两类错误

1、否定了真实的原假设
犯一型错误的概率定义为显著性水平α,即
在这里插入图片描述
可以通过控制显著性水平α来控制犯第一类错误的概率。

2、接受了错误的原假设
犯第二类错误的概率通常用β表示,即
在这里插入图片描述

扫描二维码关注公众号,回复: 8832913 查看本文章

通常来讲,在给定样本容量的情况下,如果减少犯第一类错误的概率就会增加犯第二类错误的概率,同理,减少犯第二类错误的概率,也会增加犯第一类错误的概率。如果想同时减少两类错误的概率,就需要增加样本容量,但样本容量的增加,也会导致抽样成本的增加,有时是不可行的。

在统计检验中,评价一个假设检验好坏的标准是统计检验功效,所谓功效就是正确地否定了错误的原假设的概率,用π来表示,即
在这里插入图片描述

发布了20 篇原创文章 · 获赞 14 · 访问量 855

猜你喜欢

转载自blog.csdn.net/weixin_43645790/article/details/104056832