第一章阐述样本统计量与总体属性的关系。 第二章参数估计,通过样本的统计量对总体的参数进行估计。并对估计的优劣进行判断,求最优的统计量。区间估计主要是通过置信水平,求置信区间。 第三章假设检验。总体分布已知,参数已知。通过样本的统计量,对参数的正确性进行验证。
本节的逻辑
- 对参数做出假设,$\Theta_0,\Theta_1$。
- 计算检验统计量的接受拒绝区间$W^c,W$。
- 检验统计量的拒绝接受区间对应的概率。称为势和势函数。
- 所要检验的假设称为原假设或零假设,记为$H_0$。
- 与$H_0$不相容的假设称为备择假设或对立假设,记为$H_1$。
- 对参数分布族${p(x;\theta):\theta\in\Theta}$,原假设和备择假设这对矛盾统一体,称为假设检验: $$ H_0:\theta\in\Theta_0,H_1:\theta\in\Theta_1 $$
这里最奇怪的地方是反向表示,拒绝、失信为首选方,使用简单的方式表示。$\alpha,W,\varphi(x)=1$
-
假设检验就是根据某一法则,在原假设和备择假设之间做出选择,基于样本做出拒绝$H_0$或接受$H_0$所依赖的法则称为检验。
-
检验法则:若$(x_1,\dotsm,x_n)\in W$,则拒绝$H_0$,否则由$(x_1,\dotsm,x_n)\in W^c$,就接受$H_0$。称$W$为拒绝域,$W^c$称为接受域。
拒绝度$\alpha$与拒绝域$W$一一对应。置信度$1-\alpha$与接受域(置信区间)$1-\alpha$一一对应。
- 检验统计量:能够由统计量确定拒绝域W,则统计量为检验统计量。检验统计量的检验临界值,能够区分两个检验区间。样本空间可以分为拒绝域和接受域,但是无法用数学关系式定量表达。需要使用样本的统计量的不等式,定量表示拒绝域和接受域的范围,而区分这个范围的量称为检验临界值。
- 示性函数或者检验函数 $$ \varphi(x)=\begin{cases} 1,&x\in W\ 0,&x\notin W^c \end{cases} $$
这里$\varphi(x)$所属的区间$W,W^c$是依赖于真实情况的,而不是假设检验中假设。所以他是没有错误的,不受假设错误影响的示性函数、检验函数。 比如,假设本身错误,备择假设成立。这个时候假设的$W^c$接受域为原假设接受范围,假设的拒绝域$W$为备择假设的范围。但是示性函数拒绝域的范围为假设的接受域的范围$W^c$,接受域的范围为假设的拒绝域的范围$W$
-
第一类错误:当原假设$H_0$本来成立,样本观察值落入拒绝与$W$,我们错误的拒绝了$H_0$,称为弃真错误,其概率: $$ \alpha(\theta)=P_\theta{x\in W},\theta\in\Theta_0 $$
-
第二类错误:当原假设$H_0$本来不成立时,样本观察值落入接受域$W^c$,我们错误的接受了$H_0$,称为取伪错误,其概率为: $$ \beta(\theta)=P_\theta{x\notin W}=1-P_\theta{x\in W},\theta\in\Theta_1e $$
本质上是用来衡量犯错的理论概率的,与样本检验是否犯错并没有本质联系。
这里的势是一种概率,与区间估计的拒绝度对应。
这里的势不依赖于假设,而是一种本质的基于总体真正的属性的计算值。(假设是一种猜测,验证后才可以使准确地)$\varphi(x)$是显示总体本身真实属性的函数,不依赖于假设,与是否犯错无关。
-
$H_0$ 不成立时,成功拒绝$H_0$的概率,称为势和功效。 $$ \gamma(\theta)=P_\theta{x\in W} $$ -
势函数,相当于拒绝度的衡量。
- 势函数的计算
关键点在于,\theta的范围。 $$ 当\theta\in\Theta_0,g(\theta)=\alpha(\theta)\ 当\theta\in\Theta_1,\beta(\theta)=p_\theta{x\not\in W}=1-g(\theta)\ 当\theta\in\Theta_1,g(\theta)=\gamma(\theta) $$
-
二者都具有:总体、参数、(统计量的)区间、概率。
-
区间估计。总体分布已知。参数未知。参数的分布范围与概率对应。本质上在于确定区间范围与概率的对应。是一种理论计算,不涉及具体的样本。
-
假设检验。总体分布已知。参数未知。估计参数,使用统计量的区间进行判定。概率表示出错的范围。本质上在于确定区间范围与参数假设的对应。是一种实际的计算,需要具体的样本验证。
-
这里在逻辑上没有说接受概率和拒绝概率。接受概率和拒绝概率是区间估计那里的置信度和拒绝度。而这里用犯错概率来引入概率的影响,因为这里的接受和拒绝依赖于实际的样本,而区间估计并不依赖于实际的样本,是一种理论计算。所以犯错依赖于概率。
分析:这里的检验水平就是拒绝水平。如果能在一个水平下拒绝,那么肯定也能在更大范围内拒绝,即包含真实拒绝域的拒绝域,肯定是拒绝域。因为,如果能在一个范围内接收,肯定能在更小的范围下接受。,即属于真实接受域的子集一定是接受域。
- 条件 $$ \alpha\in(0,1),\forall \theta\in\Theta\ E_\theta(\varphi(x))\leq\alpha $$
- 结论
- 条件 $$ \alpha<\alpha'<1 $$
- 结论 $$ \varphi(x)也是一个显著性水平为\alpha'的检验函数 $$
- 条件 $$ \alpha=sup{E_\theta(\varphi(x)),\theta\in\Theta} $$
- 结论
说明: 分位数:概率和概率分位数 区间估计:置信区间和置信水平 假设检验:接受域、拒绝域和概率 本质上都是区间积分与值的关系。在概率分布函数图像中即面积和面积临界值的关系。
将$\theta,W$分开理解,会比较好。但是一个题中如何分开看,如何将二者都计算出来。应该是$\theta$是个条件,$g(\theta)$势函数用来计算拒绝域与接受域的概率。
- 假设检验:$H_0,H_1$(命题的划分,不一定包含所有的情况,并集不为全集)
- 接受域拒绝域:$W^c,W$(样本空间的划分,反向定义,包含所有的情况,互补)
- 检验统计量-检验临界值区分$c$(检验统计量的划分,与样本空间的接受域和拒绝域意义对应)
- 置信度拒绝度:$1-\alpha,\alpha$(包含所有的情况,是一个琳结婚之,与检验临界值一一对应,在假设检验部分对应真实水平)