Skip to content

Latest commit

 

History

History
137 lines (108 loc) · 6.82 KB

第11节 假设检验.md

File metadata and controls

137 lines (108 loc) · 6.82 KB

假设检验

相关定义

第一章阐述样本统计量与总体属性的关系。 第二章参数估计,通过样本的统计量对总体的参数进行估计。并对估计的优劣进行判断,求最优的统计量。区间估计主要是通过置信水平,求置信区间。 第三章假设检验。总体分布已知,参数已知。通过样本的统计量,对参数的正确性进行验证。

本节的逻辑

  • 对参数做出假设,$\Theta_0,\Theta_1$。
  • 计算检验统计量的接受拒绝区间$W^c,W$。
  • 检验统计量的拒绝接受区间对应的概率。称为势和势函数。

定义1:原假设与备择假设

  • 所要检验的假设称为原假设或零假设,记为$H_0$。
  • 与$H_0$不相容的假设称为备择假设或对立假设,记为$H_1$。
  • 对参数分布族${p(x;\theta):\theta\in\Theta}$,原假设和备择假设这对矛盾统一体,称为假设检验: $$ H_0:\theta\in\Theta_0,H_1:\theta\in\Theta_1 $$

定义2:拒绝域、接受域、检验统计量、检验函数

这里最奇怪的地方是反向表示,拒绝、失信为首选方,使用简单的方式表示。$\alpha,W,\varphi(x)=1$

  • 假设检验就是根据某一法则,在原假设和备择假设之间做出选择,基于样本做出拒绝$H_0$或接受$H_0$所依赖的法则称为检验。

  • 检验法则:若$(x_1,\dotsm,x_n)\in W$,则拒绝$H_0$,否则由$(x_1,\dotsm,x_n)\in W^c$,就接受$H_0$。称$W$为拒绝域,$W^c$称为接受域。

拒绝度$\alpha$与拒绝域$W$一一对应。置信度$1-\alpha$与接受域(置信区间)$1-\alpha$一一对应。

  • 检验统计量:能够由统计量确定拒绝域W,则统计量为检验统计量。检验统计量的检验临界值,能够区分两个检验区间。样本空间可以分为拒绝域和接受域,但是无法用数学关系式定量表达。需要使用样本的统计量的不等式,定量表示拒绝域和接受域的范围,而区分这个范围的量称为检验临界值。
  • 示性函数或者检验函数 $$ \varphi(x)=\begin{cases} 1,&x\in W\ 0,&x\notin W^c \end{cases} $$

这里$\varphi(x)$所属的区间$W,W^c$是依赖于真实情况的,而不是假设检验中假设。所以他是没有错误的,不受假设错误影响的示性函数、检验函数。 比如,假设本身错误,备择假设成立。这个时候假设的$W^c$接受域为原假设接受范围,假设的拒绝域$W$为备择假设的范围。但是示性函数拒绝域的范围为假设的接受域的范围$W^c$,接受域的范围为假设的拒绝域的范围$W$

定义3:两类错误

  • 第一类错误:当原假设$H_0$本来成立,样本观察值落入拒绝与$W$,我们错误的拒绝了$H_0$,称为弃真错误,其概率: $$ \alpha(\theta)=P_\theta{x\in W},\theta\in\Theta_0 $$

  • 第二类错误:当原假设$H_0$本来不成立时,样本观察值落入接受域$W^c$,我们错误的接受了$H_0$,称为取伪错误,其概率为: $$ \beta(\theta)=P_\theta{x\notin W}=1-P_\theta{x\in W},\theta\in\Theta_1e $$

$$ p(x\in W|H_0为真)=\alpha 接受域放弃 \\ p(x\in W^c|H_0为真) 接受域本身错误 $$

$\alpha$越大,第一类错误发生的错误越小,第二类错误发生的概率越大。 不能同时减小,增加了样本容量可以减少两类错误。

定义4:势和势函数

本质上是用来衡量犯错的理论概率的,与样本检验是否犯错并没有本质联系。

这里的势是一种概率,与区间估计的拒绝度对应。

这里的势不依赖于假设,而是一种本质的基于总体真正的属性的计算值。(假设是一种猜测,验证后才可以使准确地)$\varphi(x)$是显示总体本身真实属性的函数,不依赖于假设,与是否犯错无关。

  • $H_0$不成立时,成功拒绝$H_0$的概率,称为势和功效。 $$ \gamma(\theta)=P_\theta{x\in W} $$

  • 势函数,相当于拒绝度的衡量。

$$ g(\theta)=P_\theta{x\in W}=E_\theta(\varphi(x)),\theta\in\Theta\\ $$

  • 势函数的计算

关键点在于,\theta的范围。 $$ 当\theta\in\Theta_0,g(\theta)=\alpha(\theta)\ 当\theta\in\Theta_1,\beta(\theta)=p_\theta{x\not\in W}=1-g(\theta)\ 当\theta\in\Theta_1,g(\theta)=\gamma(\theta) $$

区间估计与假设检验

  • 二者都具有:总体、参数、(统计量的)区间、概率。

  • 区间估计。总体分布已知。参数未知。参数的分布范围与概率对应。本质上在于确定区间范围与概率的对应。是一种理论计算,不涉及具体的样本。

  • 假设检验。总体分布已知。参数未知。估计参数,使用统计量的区间进行判定。概率表示出错的范围。本质上在于确定区间范围与参数假设的对应。是一种实际的计算,需要具体的样本验证。

  • 这里在逻辑上没有说接受概率和拒绝概率。接受概率和拒绝概率是区间估计那里的置信度和拒绝度。而这里用犯错概率来引入概率的影响,因为这里的接受和拒绝依赖于实际的样本,而区间估计并不依赖于实际的样本,是一种理论计算。所以犯错依赖于概率。

定义:检验水平

分析:这里的检验水平就是拒绝水平。如果能在一个水平下拒绝,那么肯定也能在更大范围内拒绝,即包含真实拒绝域的拒绝域,肯定是拒绝域。因为,如果能在一个范围内接收,肯定能在更小的范围下接受。,即属于真实接受域的子集一定是接受域。

  • 条件 $$ \alpha\in(0,1),\forall \theta\in\Theta\ E_\theta(\varphi(x))\leq\alpha $$
  • 结论

$$ \varphi(x)是一个显著性水平为\alpha 的检验函数。 $$

  • 条件 $$ \alpha<\alpha'<1 $$
  • 结论 $$ \varphi(x)也是一个显著性水平为\alpha'的检验函数 $$
  • 条件 $$ \alpha=sup{E_\theta(\varphi(x)),\theta\in\Theta} $$
  • 结论

$$ \alpha 称为真实水平 $$

说明: 分位数:概率和概率分位数 区间估计:置信区间和置信水平 假设检验:接受域、拒绝域和概率 本质上都是区间积分与值的关系。在概率分布函数图像中即面积和面积临界值的关系。

对应关系说明

将$\theta,W$分开理解,会比较好。但是一个题中如何分开看,如何将二者都计算出来。应该是$\theta$是个条件,$g(\theta)$势函数用来计算拒绝域与接受域的概率。

  • 假设检验:$H_0,H_1$(命题的划分,不一定包含所有的情况,并集不为全集)
  • 接受域拒绝域:$W^c,W$(样本空间的划分,反向定义,包含所有的情况,互补)
  • 检验统计量-检验临界值区分$c$(检验统计量的划分,与样本空间的接受域和拒绝域意义对应)
  • 置信度拒绝度:$1-\alpha,\alpha$(包含所有的情况,是一个琳结婚之,与检验临界值一一对应,在假设检验部分对应真实水平)