假设检验

相关定义

第一章阐述样本统计量与总体属性的关系。第二章参数估计，通过样本的统计量对总体的参数进行估计。并对估计的优劣进行判断，求最优的统计量。区间估计主要是通过置信水平，求置信区间。第三章假设检验。总体分布已知，参数已知。通过样本的统计量，对参数的正确性进行验证。

本节的逻辑

对参数做出假设，$\Theta_0,\Theta_1$。

计算检验统计量的接受拒绝区间$W^c,W$。

检验统计量的拒绝接受区间对应的概率。称为势和势函数。

定义1：原假设与备择假设

所要检验的假设称为原假设或零假设，记为$H_0$。
与$H_0$不相容的假设称为备择假设或对立假设，记为$H_1$。
对参数分布族${p(x;\theta):\theta\in\Theta}$，原假设和备择假设这对矛盾统一体，称为假设检验： $$ H_0:\theta\in\Theta_0,H_1:\theta\in\Theta_1 $$

定义2：拒绝域、接受域、检验统计量、检验函数

这里最奇怪的地方是反向表示，拒绝、失信为首选方，使用简单的方式表示。$\alpha,W,\varphi(x)=1$

假设检验就是根据某一法则，在原假设和备择假设之间做出选择，基于样本做出拒绝$H_0$或接受$H_0$所依赖的法则称为检验。
检验法则：若$(x_1,\dotsm,x_n)\in W$，则拒绝$H_0$，否则由$(x_1,\dotsm,x_n)\in W^c$，就接受$H_0$。称$W$为拒绝域，$W^c$称为接受域。

拒绝度$\alpha$与拒绝域$W$一一对应。置信度$1-\alpha$与接受域（置信区间）$1-\alpha$一一对应。

检验统计量：能够由统计量确定拒绝域W，则统计量为检验统计量。检验统计量的检验临界值，能够区分两个检验区间。样本空间可以分为拒绝域和接受域，但是无法用数学关系式定量表达。需要使用样本的统计量的不等式，定量表示拒绝域和接受域的范围，而区分这个范围的量称为检验临界值。
示性函数或者检验函数 $$ \varphi(x)=\begin{cases} 1,&x\in W\ 0,&x\notin W^c \end{cases} $$

这里$\varphi(x)$所属的区间$W,W^c$是依赖于真实情况的，而不是假设检验中假设。所以他是没有错误的，不受假设错误影响的示性函数、检验函数。比如，假设本身错误，备择假设成立。这个时候假设的$W^c$接受域为原假设接受范围，假设的拒绝域$W$为备择假设的范围。但是示性函数拒绝域的范围为假设的接受域的范围$W^c$，接受域的范围为假设的拒绝域的范围$W$

定义3：两类错误

第一类错误：当原假设$H_0$本来成立，样本观察值落入拒绝与$W$，我们错误的拒绝了$H_0$，称为弃真错误，其概率： $$ \alpha(\theta)=P_\theta{x\in W},\theta\in\Theta_0 $$
第二类错误：当原假设$H_0$本来不成立时，样本观察值落入接受域$W^c$，我们错误的接受了$H_0$，称为取伪错误，其概率为： $$ \beta(\theta)=P_\theta{x\notin W}=1-P_\theta{x\in W},\theta\in\Theta_1e $$

$$ p(x\in W|H_0为真)=\alpha 接受域放弃 \\ p(x\in W^c|H_0为真) 接受域本身错误 $$

$\alpha$越大，第一类错误发生的错误越小，第二类错误发生的概率越大。不能同时减小，增加了样本容量可以减少两类错误。

定义4：势和势函数

本质上是用来衡量犯错的理论概率的，与样本检验是否犯错并没有本质联系。

这里的势是一种概率，与区间估计的拒绝度对应。

这里的势不依赖于假设，而是一种本质的基于总体真正的属性的计算值。（假设是一种猜测，验证后才可以使准确地）$\varphi(x)$是显示总体本身真实属性的函数，不依赖于假设，与是否犯错无关。

$H_0$不成立时，成功拒绝$H_0$的概率，称为势和功效。 $$ \gamma(\theta)=P_\theta{x\in W} $$
势函数，相当于拒绝度的衡量。

$$ g(\theta)=P_\theta{x\in W}=E_\theta(\varphi(x)),\theta\in\Theta\\ $$

势函数的计算

关键点在于，\theta的范围。 $$ 当\theta\in\Theta_0,g(\theta)=\alpha(\theta)\ 当\theta\in\Theta_1,\beta(\theta)=p_\theta{x\not\in W}=1-g(\theta)\ 当\theta\in\Theta_1,g(\theta)=\gamma(\theta) $$

区间估计与假设检验

二者都具有：总体、参数、（统计量的）区间、概率。
区间估计。总体分布已知。参数未知。参数的分布范围与概率对应。本质上在于确定区间范围与概率的对应。是一种理论计算，不涉及具体的样本。
假设检验。总体分布已知。参数未知。估计参数，使用统计量的区间进行判定。概率表示出错的范围。本质上在于确定区间范围与参数假设的对应。是一种实际的计算，需要具体的样本验证。
这里在逻辑上没有说接受概率和拒绝概率。接受概率和拒绝概率是区间估计那里的置信度和拒绝度。而这里用犯错概率来引入概率的影响，因为这里的接受和拒绝依赖于实际的样本，而区间估计并不依赖于实际的样本，是一种理论计算。所以犯错依赖于概率。

定义：检验水平

分析：这里的检验水平就是拒绝水平。如果能在一个水平下拒绝，那么肯定也能在更大范围内拒绝，即包含真实拒绝域的拒绝域，肯定是拒绝域。因为，如果能在一个范围内接收，肯定能在更小的范围下接受。，即属于真实接受域的子集一定是接受域。

条件 $$ \alpha\in(0,1),\forall \theta\in\Theta\ E_\theta(\varphi(x))\leq\alpha $$
结论

$$ \varphi(x)是一个显著性水平为\alpha 的检验函数。 $$

条件 $$ \alpha<\alpha'<1 $$
结论 $$ \varphi(x)也是一个显著性水平为\alpha'的检验函数 $$
条件 $$ \alpha=sup{E_\theta(\varphi(x)),\theta\in\Theta} $$
结论

$$ \alpha 称为真实水平 $$

说明：分位数：概率和概率分位数区间估计：置信区间和置信水平假设检验：接受域、拒绝域和概率本质上都是区间积分与值的关系。在概率分布函数图像中即面积和面积临界值的关系。

对应关系说明

将$\theta,W$分开理解，会比较好。但是一个题中如何分开看，如何将二者都计算出来。应该是$\theta$是个条件，$g(\theta)$势函数用来计算拒绝域与接受域的概率。

假设检验：$H_0,H_1$（命题的划分，不一定包含所有的情况，并集不为全集）
接受域拒绝域：$W^c,W$(样本空间的划分，反向定义，包含所有的情况，互补)
检验统计量-检验临界值区分$c$（检验统计量的划分，与样本空间的接受域和拒绝域意义对应）
置信度拒绝度：$1-\alpha,\alpha$（包含所有的情况，是一个琳结婚之，与检验临界值一一对应，在假设检验部分对应真实水平）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

第11节假设检验.md

第11节假设检验.md

假设检验

相关定义

定义1：原假设与备择假设

定义2：拒绝域、接受域、检验统计量、检验函数

定义3：两类错误

定义4：势和势函数

区间估计与假设检验

定义：检验水平

对应关系说明

Files

第11节 假设检验.md

Latest commit

History

第11节 假设检验.md

File metadata and controls

假设检验

相关定义

定义1：原假设与备择假设

定义2：拒绝域、接受域、检验统计量、检验函数

定义3：两类错误

定义4：势和势函数

区间估计与假设检验

定义：检验水平

对应关系说明

第11节假设检验.md

第11节假设检验.md