统计学8——假设检验
当原假设H为真时,却错误的拒绝了原假设,导致由部分推断总体的判断发生错误,犯这种错误的概率用α表示,统计上把α称为假设检验中的显著性水平。备择假设是指如果原假设不成立,就要拒绝原假设,而需要在另一个假设中做出选择,这个假设与原假设对立的假设,也称“研究假设”,表示为$H_{1}$,(研究者想收集证据予以支持的假设总是有不等号)。从假设检验的原理来看,不拒绝原假设只能说明与原假设相矛盾的小概率事件没
目录
结构框架
内容精读
1.假设检验形式
上一章参数估计研究的是用样本统计量估计总体参数的方法,其总体参数在研究前是未知的。本章假设检验则是对总体参数先做一个假设,然后利用样本信息去验证假设是否成立。
假设检验的基本形式如下:
原假设$H_{0}:\mu=\mu_{0}$
备择假设$H_{1}:\mu\neq {\mu_{0}}$
原假设与备择假设之间相互排斥,肯定一个则拒绝另一个,因此假设检验便是在是否接受原假设的基础上展开。
两类错误
对于假设检验时原假设是否成立的判断可能正确也可能是错误的,由此衍生出了两个错误类型。
- 第一类错误,也称$\alpha$错误或弃真错误。是指原假设$H_{0}$为真但被拒绝。
- 第二类错误,也称$\beta$错误或取伪错误。指原假设为假但被接受。
在实际中我们希望犯两个错误的概率越小越好,但两个错误的概率却不能同时减小。如果减小$\alpha$错误,就会增加犯$\beta$错误的可能,反之减少$\beta$错误也是如此。要想同时减小两类错误,只能增大样本量。
在无法兼顾两类错误的情况下,大家都遵循着首先控制$\alpha$错误的原则,因为从实用的观点来看,原假设往往是明确的,我们更关心如果这个假设为真但却被我们拒绝了,这类错误可能性有多大。
通过P值进行决策
对于什么是P值,我们举这样一个例子,原假设为两个总体的均值相同,如果原假设成立,那么从中随机抽取若干个样本,其结果与原假设不符的概率有多大,这个概率就是P值。总结来说P值就是当原假设为真时,样本观察结果出现更极端现象的概率。当然P值越小这种情况发生的概率就越低,P值越大就越可能发生,因此当P大于一定值时我们便有理由拒绝原假设。
单侧检验
与双侧检验有两个拒绝域不同,单侧检验只有一个拒绝域。
$H_{0}:\mu\geqslant {x}$
$H_{1}:\mu<x$
$H_{0}:\mu\leqslant {x}$
$H_{1}:\mu>x$
2.一个总体参数的检验
2.1总体均值的检验
在显著性水平$\alpha$下。
双侧检验 | 单侧检验 | ||
左侧检验 | 右侧检验 | ||
假设 | $$H_{0}:\mu=\mu_{0}$$ $$H_{1}:\mu\neq{\mu_{0}}$$ | $$H_{0}:\mu\geqslant{\mu_{0}}$$ $$H_{1}:\mu<\mu_{0}$$ | $$H_{0}:\mu\leqslant{\mu_{0}}$$ $$H_{1}:\mu>\mu_{0}$$ |
统计量(大样本) | $$z=\frac{\bar{x}-\mu_{0}} {\sigma(或s)/\sqrt{n}}$$ | ||
$z>\left | z_{\alpha/2} \right |$ 拒绝$H_{0}$ | $z<z_{\alpha}$ 拒绝$H_{0}$ | $z>z_{\alpha}$ 拒绝$H_{0}$ | |
统计量(小样本$\sigma$已知) | $$z=\frac{\bar{x}-\mu_{0}} {\sigma/\sqrt{n}}$$ | ||
$z>\left | z_{\alpha/2} \right |$ 拒绝$H_{0}$ | $z<z_{\alpha}$ 拒绝$H_{0}$ | $z>z_{\alpha}$ 拒绝$H_{0}$ | |
统计量(小样本,$\sigma$未知) | $$t=\frac{\bar{x}-\mu_{0}}{s/\sqrt{n}}$$ | ||
$t>\left | t_{\alpha/2} \right |$ 拒绝$H_{0}$ | $t<t_{\alpha}$ 拒绝$H_{0}$ | $t>t_{\alpha}$ 拒绝$H_{0}$ |
2.2总体比例检验
对于总体比例的检验只有z统计量,因为针对比例的问题往往都是大样本,小样本是不稳定的。
双侧检验 | 单侧检验 | ||
左侧检验 | 右侧检验 | ||
假设 | $$H_{0}:\pi=\pi_{0}$$ $$H_{1}:\pi\neq{\pi_{0}}$$ | $$H_{0}:\pi\geqslant{\pi_{0}}$$ $$H_{1}:\pi<\pi_{0}$$ | $$H_{0}:\pi\leqslant{\pi_{0}}$$ $$H_{1}:\pi>pi_{0}$$ |
统计量 | $$z=\frac{p-\pi_{0}} {\sqrt{\frac{\pi_{0}(1-\pi_{0})}{n}}}$$ | ||
$z>\left | z_{\alpha/2} \right |$ 拒绝$H_{0}$ | $z<z_{\alpha}$ 拒绝$H_{0}$ | $z>z_{\alpha}$ 拒绝$H_{0}$ |
2.3总体方差检验
方差检验使用$\chi^2$统计量。
单侧检验 | ||
左侧检验 | 右侧检验 | |
假设 | $$H_{0}:\sigma^2\geqslant{\sigma_{0}^2}$$ $$H_{1}:\sigma^2<\sigma_{0}^2$$ | $$H_{0}:\sigma^2\leqslant{\sigma_{0}^2}$$ $$H_{1}:\sigma^2>\sigma_{0}^2$$ |
统计量 | $$\chi^2=\frac{(n-1)s^2} {\sigma^2}$$ | |
$\chi^2<\chi^2_{\alpha}$ 拒绝$H_{0}$ | $\chi^2>\chi^2_{\alpha}$ 拒绝$H_{0}$ |
3.两个总体参数的检验
3.1均值差检验
双侧检验 | 单侧检验 | ||
左侧检验 | 右侧检验 | ||
假设 | $$H_{0}:\mu_{1}-\mu_{2}=0$$ $$H_{1}:\mu_{1}-\mu_{2}\neq0$$ | $$H_{0}:\mu_{1}-\mu_{2}\geqslant 0$$ $$H_{1}:\mu_{1}-\mu_{2}< 0$$ | $$H_{0}:\mu_{1}-\mu_{2}\leqslant 0$$ $$H_{1}:\mu_{1}-\mu_{2}>0$$ |
$\sigma^2_{1},\sigma^2_{2}$已知 | $$z=\frac{(\bar{x_{1}-\bar{x}_{2}})-(\mu_{1}-\mu_{2})} {\sqrt{\frac{\sigma_{1}^2}{n_{1}} \frac{\sigma_{2}^2}{n_{2}}}}$$ | ||
$z>\left | z_{\alpha/2} \right |$ 拒绝$H_{0}$ | $z<z_{\alpha}$ 拒绝$H_{0}$ | $z>z_{\alpha}$ 拒绝$H_{0}$ | |
$\sigma^2_{1},\sigma^2_{2}$未知,但n较大 | $$z=\frac{(\bar{x_{1}-\bar{x}_{2}})-(\mu_{1}-\mu_{2})} {\sqrt{\frac{\sigma_{1}^2}{n_{1}} \frac{\sigma_{2}^2}{n_{2}}}}$$ | ||
$z>\left | z_{\alpha/2} \right |$ 拒绝$H_{0}$ | $z<z_{\alpha}$ 拒绝$H_{0}$ | $z>z_{\alpha}$ 拒绝$H_{0}$ | |
$\sigma^2_{1},\sigma^2_{2}$未知,且n较小,但$\sigma^2_{1}=\sigma^2_{2}$ | $$t=\frac{(\bar{x_{1}-\bar{x}_{2}})-(\mu_{1}-\mu_{2})} {s_{p}\sqrt{\frac{1}{n_{1}} \frac{1}{n_{2}}}}$$ | ||
$t>\left | t_{\alpha/2} \right |$ 拒绝$H_{0}$ | $t<t_{\alpha}$ 拒绝$H_{0}$ | $t>t_{\alpha}$ 拒绝$H_{0}$ | |
$\sigma^2_{1},\sigma^2_{2}$未知,且n较小,且没有理由认为$\sigma^2_{1}=\sigma^2_{2} | $$t=\frac{(\bar{x_{1}-\bar{x}_{2}})-(\mu_{1}-\mu_{2})} {\sqrt{\frac{s^2}{n_{1}} \frac{s^2}{n_{2}}}}~t(n_{1}+n_{2}-2)$$ | ||
$t>\left | t_{\alpha/2} \right |$ 拒绝$H_{0}$ | $t<t_{\alpha}$ 拒绝$H_{0}$ | $t>t_{\alpha}$ 拒绝$H_{0}$ |
3.2比例差检验
两总体比例相等的检验
双侧检验 | 单侧检验 | ||
左侧检验 | 右侧检验 | ||
假设 | $$H_{0}:\pi_{1}=\pi_{2}$$ $$H_{1}:\pi_{1}\neq{\pi_{2}}$$ | $$H_{0}:\pi_{1}\geqslant{\pi_{2}}$$ $$H_{1}:\pi_{2}<\pi_{2}$$ | $$H_{0}:\pi_{1}\leqslant{\pi_{2}}$$ $$H_{1}:\pi_{1}>pi_{2}$$ |
统计量 | $$z=\frac{p_{1}-\pi_{2}} {\sqrt{p(1-p)(\frac{1}{n}+\frac{1}{n_{2}})}}$$ 其中$p=\frac{p_{1}n_{1}+p_{2}n_{2}}{n_{1}+n_{2}}$ | ||
$z>\left | z_{\alpha/2} \right |$ 拒绝$H_{0}$ | $z<z_{\alpha}$ 拒绝$H_{0}$ | $z>z_{\alpha}$ 拒绝$H_{0}$ |
检验两比例之差不为0的假设
双侧检验 | 单侧检验 | ||
左侧检验 | 右侧检验 | ||
假设 | $$H_{0}:\pi_{1}-\pi_{2}=d_{0}$$ $$H_{1}:\pi_{1}-\pi_{2}\neq{d_{0}}$$ | $$H_{0}:\pi_{1}-\pi_{2}\geqslant{d_{0}}$$ $$H_{1}:\pi_{2}-\pi_{2}<d_{0}$$ | $$H_{0}:\pi_{1}-\pi_{2}\leqslant{d_{0}}$$ $$H_{1}:\pi_{1}-pi_{2}>d_{0}$$ |
统计量 | $$z=\frac{p_{1}-p_{2}-d_{0}}{ \sqrt{ \frac{p_{1}(1-p_{1})}{n_{1}}+\frac{p_{2}(1-p_{2})}{n_{2} }} }$$ | ||
$z>\left | z_{\alpha/2} \right |$ 拒绝$H_{0}$ | $z<z_{\alpha}$ 拒绝$H_{0}$ | $z>z_{\alpha}$ 拒绝$H_{0}$ |
3.3方差比检验
因为两总体方差是否相等往往不会事先知道,因此进行两总体均值之差检验前,先进行方差是否相等的检验。
双侧检验 | 单侧检验 | ||
左侧检验 | 右侧检验 | ||
假设 | $$H_{0}:\sigma^2_{1}=\sigma_{2}^2$$ $$H_{1}:\sigma_{1}^2\neq{\sigma_{2}^2}$$ | $$H_{0}:\sigma^2_{1}\geqslant{\sigma_{2}^2}$$ $$H_{1}:\sigma_{1}^2<{\sigma_{2}^2}$$ | $$H_{0}:\sigma^2_{1}\leqslant{\sigma_{2}^2}$$ $$H_{1}:\sigma_{1}^2>{\sigma_{2}^2}$$ |
统计量 | $$F=\frac{s^2_{1}/\sigma_{1}^2} {s_{2}^2/\sigma^2_{2}}$$ 一般$s_{2}>s_{1}$ | ||
$F_{\alpha/2}>F>F_{1-\alpha/2}$ 拒绝$H_{0}$ | $F<F_{1-\alpha}$ 拒绝$H_{0}$ | $F>F_{\alpha}$ 拒绝$H_{0}$ |
4.假设检验的结果解读
从假设检验的原理来看,不拒绝原假设只能说明与原假设相矛盾的小概率事件没有发生,但可能还有其他的小概率事件,因此“接受原假设”的说法是不严谨的,应当为“没有充分的理由拒绝原假设”。
名词解释
假设检验:
假设检验是指事先对总体参数或分布形式作出某种假妥.保障然后利用样本信息来判断原假设是否成立;分为参数假设检验和非参数假设检验。
原假设
原假设称为待检验的假设,又称“零假设”,用$H_{0}$表示(研究者想收集证据予以反对的假设)。原假设是在一次试验中有绝对优势出现的事件,而备择假设在一次试验中不易发生(或几乎不可能发生) 的事件。因此,在进行单侧检验时,最好把原假设取为预想结果的反面,即把希望证明的命题放在备择假设上。
备择假设
备择假设是指如果原假设不成立,就要拒绝原假设,而需要在另一个假设中做出选择,这个假设与原假设对立的假设,也称“研究假设”,表示为$H_{1}$,(研究者想收集证据予以支持的假设总是有不等号)。
显著性水平
当原假设H为真时,却错误的拒绝了原假设,导致由部分推断总体的判断发生错误,犯这种错误的概率用α表示,统计上把α称为假设检验中的显著性水平。显著性水平取α,意味着在原假设成立时,如果事件的发生概率小于α则认为原假设不成立。换言之,我们有1-α的把握拒绝原假设。α取不同的水平,将直接影响到拒绝域的临界值,并进而影响到判断结果。
检验统计量
检验统计量是用于假设检验计算的统计量。在零假设情况下,这项统计量服从一个给定的概率分布,而这在另一种假设下则不然。从而若检验统计量的值落在上述分布的临界值之外,则可认为前述零假设未必正确。
P值
P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,就有理由拒绝原假设,P值越小,拒绝原假设的理由就越充分。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)