关于假设检验的两类错误问题的分析--论文

关于假设检验的两类错误问题的分析

摘要：本文对假设检验的两类错误问题进行分析，阐述了两类错误问题的基本概念，讨论了两类错误的产生的原因和它们之间的关系，并给出了减少统计假设检验中两类错误发生的方法。

关键词：假设检验，两类错误，关系，控制

统计学知识具有理论丰富、应用广泛的特征，在生产实践中具有强烈的应用背景[1]，由于受到人力、物力、财力、时间等的限制，以及某些实验与检测的破坏性，人们在实践中对总体的某一数量特征进行评估时，常常采取从总体中抽取若干数量的随机样本，然后，依据“小概率原理”和样本信息，用假设检验方法对总体数量特征做出判断。例如，商业银行对企业进行信用评估问题[2]，产品生产线工作是否异常的判断问题，炮弹质量检测问题等都要用到统计学中假设检验方面的知识。人们总是希望能够依据样本信息做出关于总体特征的正确判断或决策。然而，由于样本是从总体中随机抽取的，用少量的随机样本信息来对总体的某些特征进行假设检验难免不犯错误，这些错误我们通常称为假设检验的两类错误问题。本文对假设检验的两类错误问题进行分析，阐述了两类错误问题的基本概念，讨论了两类错误的产生的原因和它们之间的关系，并给出了减少统计假设检验中两类错误发生的方法。

1问题引入

由下例引出的问题[3]：

例1:已知罐头番茄汁中维生素C含量服从正态分布，按规定，维生素C的平均含量不得少于21毫克，现在从一批罐头中抽取17罐。算得维生素C含量的平均值X=23，S2=31982，问该批罐头维生素c含量是否合格? （α=0.05）。解:维生素c含量X~N（μ，α2），检验假设:H0：μ

查表得t0.05=1.746，即P{T>1.746}=0.05，经计算T=2.07>1.746，于是否定H0，认为μ≥21，即该批罐头合格。在本例中，罐头是否合格，在解答之前并不知道，那么，为什么要设为H021呢？如果说两种地位均等，取哪一个都行，那么将会得出什么结论。请看下例:

例2：例1中将平均值改为X=22，其它不变。

解：（1）检验假设H0：

（2）检验假设H0：μ≥21，计算同上，由于P{T1.746，所以接受，即认为该批罐头合格。在同一个检验标准下会有相反的结论，这样的检验是不能付诸现实的。上面的例子是所谓单边检验，单边检验因为要有说明，所以理解起来似乎更困难一些，但是，在理论上对单边检验的研究却是对双边检验研究的基础，同时单边检验在实际中有许多应用[4]。事实上，对于形如那样的双边检验也会遇到类似的问题。

例3：某砖厂生产的砖抗断强度服从正态分布，已知α2=1.21，今从一批砖中随便地抽取6块，测得抗断强度平均值=31.88公斤/平方厘米，现在问：这批转的平均抗断强度可否认为是32.50公斤/平方厘米（α=0.05）

解:（1）抗断强度X N（32.50，1.12），检验假设H0:μ=32.50，当H0成立时，

查表知P{U>1.96}=0.05，但现在U=1.38

（2）又根据反证法的思想也可检验32.50，于是有检验假设H1：μ>32.50，当H1成立时，

查表得μ0.05=1.65，由于P{-1.65，所以不能否定H1，当然H0不能成立[5]。问题究竟出在哪里呢？

2假设检验的两类错误

2.1假设检验的基本原理

假设检验的最基本原理是显著性原理，是根据样本观测值来判断是否有显著差异，这个差异是由两种可能因素引起的，一是系统性因素，一是偶然性因素。问题的关键在于:这个差异是否可以仅以偶然性这个因素去解释，也就是说是否有充分的理由来否定这种解释。如果有，就否定原假设，如果没有，就只能接受它。假设检验的基本思想是应用小概率原理，所谓小概率原理就是认为小概率事件在一次试验中是几乎不可能发生的，如果发生了，就有充分的理由怀疑原假设

为真，也即拒绝原假设[6]。

2.2两类错误

如果原假设H0成立，而观察值落入否定域，从而作出拒绝H0的错误结论，称作第一类错误，第一类错误是“以真当假”，犯第一类错误的概率不超过显著性水平α。

如果原假设H0不成立，而观察值未落入否定域，从而作出接受H0的错误结论，称作第二类错误，第二类错误是“以假当真”，犯第二类错误的概率记作β

[7]。

两类错误的分类见表1[8]。

表 1 显著性检验判断结果分类

犯“弃真”错误的前提条件是H0为真，犯“取伪”错误的前提条件是H0为假，由于犯两类错误的前提条件不同，故犯“弃真”错误与“取伪”错误不是对立事件，因而，在一般情况下α+β≠1。关于犯“取伪”错误的概率β的计算问题，以及犯两类错误的概率α与β以及样本数量 n 之间的数量关系问题，比较复杂，需要知道总体的分布及其相关参数[9]。然而，由中心极限定理知，无论总体 X 服从什么分布，来自总体 X 的独立同分布随机样本Xi（i =1，2，„，n）在样本容量n较大时（n≥30），其均值都近似服从正态分布。因而，以正态总体为例研究犯两类错误的概率与样本容量之间的数量关系具有一般性。

2.3两类错误产生的原因

在实践中.检验者往往确定允许犯第一类错误概率的最大值，称为检验的显著性水平（一般选择0.01或0.05）。结果是，在拒绝H0时，要么结论正确，要么犯第一类错误（小慨率事件）。因此，当样本数据支持H0时，犯错误的可能性大小（概率α）是可控的。但是，当样本数据不支持拒绝H0时，我们只好接受H0，这时就有可能犯第二类错误，而第二类错误并不是总能控制的，也即在决定接受H0时，其决策正确的概率是不确定的。因此，在样本数据不支持拒绝H0时，应使用“不能拒绝H0”而非“接受H0”的结论。显然，当样本数据拒绝H0时，采取任何相应的行动都是恰当的（这就是要选择对被择假没进行检验的理由）;当样本数据不能拒绝H0时，在研究性和陈述正确性检验中不必采取行动，但在决策情况下，必须接受H0并采取相应行动，此时就会冒犯第二类错误的风险[9]。 3假设检验中两种类型错误之间的关系

（一） α与β是在两个前提下的概率。α是拒绝H0时犯错误的概率（这时

前提是“H0为真”）；β是接受H0时犯错误的概率（这时“H0为假”是前提），所以α+β不一定等于1。结合图1分析如下：

图1 α与β的关系示意图

如果H0：μ1＝μ0为真，关于与μ0的差异就要在图1中左边的正态分布

。（将两端各α/2放在同一端）。中讨论。对于某一显著性水平α其临界点为

α。在“H0为真”的前提下随机得到的

的。由于

的概率等于α。而

H0是正确决定，右边表示H0的拒绝区，面积比率为α；左边表示H0的接受区，面积比率为1－落到拒绝区时我们拒绝H0是犯了错误

落到拒绝区的概率为α，因此拒绝“H0为真”时所犯错误（I型）落到H0的接受区时，由于前提仍是“H0为真”，因此接受落在接受区的概率为1－α，那么正确接受H0的概率就等于1－α。如α＝0.05则1－α=0.95，这0.05和0.95均为“H0为真”这一前提下的两个概率，一个指犯错误的可能性，一个指正确决定的可能性，这二者之和当然为1[10]。但讨论β错误时前提就改变了，要在“H0为假”这一前提下讨论。对于H0是真是假我们事先并不能确定，如果H0为假、等价于Hl为真，这时需要在图1中右边的正态分布中讨论（H1：μ1 >μ0），它与在“H0为真”的前提下所讨论的相似，

一定等于0.95。

（二）在其他条件不变的情况下，α与β不可能同时减小或增大。这一点从图1也可以清楚看到。当临界点

之向右移时，α减小，但此时β一定增大；反向左移则α增大β减小。一般在差异检验中主要关心的是能否有充分理由落在临界点左边时要拒绝Hl （即接受H0），而前提Hl为真，因而犯了错误，这就是II型错误，其概率为β。很显然，当α＝0.05时，β不拒绝H0[11]，从而证实Hl，所以在统计中规定得较严。至于β往往就不予重视了，其实许多情况需要在规定的同时尽量减小β。这种场合最直接的方法是增大样本容量。因为样本平均数分布的标准差为，当n增大时样本平均数分布将变得陡峭[12]，在α和其他条件不变时β会减小（见图2）。

图2 不同标准差影响β大小示意图

（三）在图1中Hl为真时

边时拒绝Hl所犯错误的概率为β的分布下讨论β错误已指出[13]落到临界点左。那么落在临界点右边时接受Hl则为正确决定，其概率等于1—β。换言之，当 Hl为真，即μ1与μ0确实有差异时（图1中，μ1与μ0的距离即表示μ1与μ0的真实差异），能以（1—β）的概率接受之[14]。

如图1所示，当α以及其他条件不变时，减小μ1与μ0的距离势必引起β增大、（1—β）减小，也就是说，其他条件不变，μ1与μ0真实差异很小时，正确接受Hl的概率变小了。或者说正确地检验出真实差异的把握度降低了。相反，若其他条件不变μ1与μ0的真实差异变大时，（1—β）增大即接受Hl的把握度增大。所以说1—β反映着正确辨认真实差异的能力。统计学中称（1—β）为统计检验力。这是个比较重要的统计学概念。假如真实差异很小时，某个检验仍能以较大的把握接受它，就说这个检验的统计检验力比较大[15]。

4两类错误的控制

4.1增加样本容量n

我们以正态分布为例，正态分布有两个参数μ和σ，μ是位置参数，μ越小，正态分布曲线的中心越向左移，μ越大，越向右移。σ是形状参数，σ越大正态分布曲线越平缓低阔，σ越小曲线越陡峭高狭，在总体平均数显著性检验中，检验常常是在平均数为μ0，标准差为σ/n的正态分布中进行的。n 越大，则σ/n越小，正态分布形状越陡峭高狭，因而接受域上面积也就越小。故当样本容量n 较大时，β较小，在检验中要想同时减少犯两类错误的概率α和β，最为有效的方法就是增加样本的容量。但是，增加样本容量则意味着增加抽检费用和时间，有时并不容易实现，因此在多数场合，α不宜定得太小[16]。

4.2 根据研究的需要选择合适的α水平

在样本容量n与μ都不变的条件下，α水平减少则β值就要增大。因此，我们就要根据研究的需要，选择合适的α水平来降低统计错误的发生。当一个研究力求证明所比较的两个总体在某个指标上存在差别时，研究者当然希望所推断的方法具有较高的可靠性，此时，在统计假设检验中就得力求有更高的把握拒绝原假设，而要达到这个目的[17]，就要使α水平减小，使犯弃真错误的概率降低；当一个研究力求证明所比较的两个总体在某个指标上没有差异时，在统计假设检验中就要力求接受 H0，这时只有犯纳违的错误的可能性。因此，可将α水平调大以减小β水平，以提高统计结论的可靠性。

4.3 尽可能采用单侧检验在统计假设

H0：μ=μ0；H1:μ＞μ0下，单侧检验的临界值由下式确定：P｛μ0＞μa｝=a，双侧检验的临界值则由下式确定：P｛|μ0|＞μa/2｝=a。单侧检验的临界值比双侧检验的临界值更靠近H0分布的中心，所以单侧检验时，临界值较小。文献[18]中给出下面两个结论：

根据上面两式可知，β相应较小。基于这一原因，凡是可以采用单侧检验的场合，应尽量采用单侧检验，以达到减小犯第二类错误的目的。

5结论

假设检验是一种在实际种经常用到的一种统计方法，而且在各个领域内也应用的十分广泛，比如体育统计，医学统计等等。很多时候，人们只注意了犯第一类错误的概率α，而忽略了第二类错误的概率;有的时候，人们将假设检验中的原假设H0与备择假设H1分开，只是将备择假设H1放于假设之中，而没有真正的考虑犯第二类错误的概率。

同时，在实际应用中，要根据实际情况具体分析，比如某药物治疗高血压，平均降低舒张压0.5kPa，并得出差别有高度统计学意义的结论。从统计学角度，说明该药有降压作用，但实际上，降低0.5kPa是无临床意义。因此要结合专业作出恰如其分的结论。

参考文献：

[1]周绮凤,刘闽,林成德. 商业银行信用风险评估中“拒真纳伪”两类错误的平衡控制研究[J]. 厦门大学学报(自然科学版),2005,03:322-325.

[2]于维生. 确定产品检验两类错误概率的博弈论方法[J]. 数理统计与管理,2006,05:549-554.

[3]蔡越江. 论假设检验中的两类错误[J]. 数理统计与管理,1999,03:31-35+66.

[4]张忠群. 对假设检验中两类错误的探讨[J]. 六盘水师范高等专科学校学报,2006,06:4-7.

[5]刘凤霞. 假设检验中两类错误的几何解释[J]. 渤海大学学报(自然科学版),2007,03:251-253.

[6]曹玲. 关于假设检验中两类错误的探讨[J]. 云南财贸学院学报（社会科学版）,2004,04:78-80.

[7] 陈家鼎，孙山泽，李东风.数理统计学讲义[M].北京:北京大学出版社，1997.82-88.

[8]卢亚丽. 假设检验中两类错误分析与实验[J]. 河南教育学院学报（自然科学版），2011，03:9-12.

[9]徐瑞标. 假设检验中两类错误的计算及其关系的探讨[J]. 吉林师范大学学报(自然科学版),2013,02:146-148.

[10]王德劲. 论假设检验中两类错误的关系[J]. 内江科技，2006，01:114+135.

[11]林彬. 假设检验在体育数据统计中的应用[J]. 中国管理信息化,2013,11:103-105.

[12]王琳,陈峥. 浅析假设检验中的几个问题[J]. 现代商业,2013,09:165-166.

[13]王凡彬. 假设检验与区间估计的关系问题[J]. 四川文理学院学报,2013,02:7-9.

[14]苗敬毅,乔兵兵. 浅谈有关假设检验[J]. 物流工程与管理,2012,12:163-164+153.

[2]刘瑞香,杨录胜. 关于两种检验统计量为单峰分布时的最佳双边检验[J]. 大学数学,2012,06:74-77.

[15]张慧娟. 异常数据检验的几种方法[D].燕山大学,2012.

[16]苏再兴,王志福,管杰 . 假设检验中两类错误及其关系的探讨[J]. 科技信息,2010,35:233+117.

[17]郭文. 两类错误条件下方差检验中样本容量的确定[J]. 统计与决策,2012,09:12-14.

[18]吕黎明. 对一类假设检验问题中两类错误的分析[J]. 高等函授学报:自然科学版,2003,16

（6）.