维普资讯 http://www.cqvip.com
假设检验中两类错误的成因 发生概率及其相关问题
以单个总体均值检验为例
李文华, 雷金星
( 广西师范大学 政管学院,广西 桂林 5 10 ) 40 1
摘
要: 本文以单个均值检验为例, 首先分析了统计检验 中两类理论错误发生的原因: 错误由 O t
实际推断原理引起; 错误 由逻辑谬误引起; p 之后, 分别计算了它们发生的概率大小并与之相关的问
题做 出了解释 ; 此基础上 , 在 笔者简要说 明了“ 否证” 思想在 实证研 究 中的合理性。 关键词 : 两类错误 ; 因; 原 概率 ;否证 ” “
中图分类号:2 0 1
文献标识码: A
文章编号:02 68( 0)20 — 3 10 —47 05 - 17 0 2 0 1
解释 , 这种解释是 相关解释 而不 是因果解 释。这 种思想认为
1 问 题 的 缘 起 如果运用定量的方法来研究社会现象之间是否存在差 异, 需要借助统计学中假设检验这个手段。统计检验的假设 形式为:
科学研究 的 目的不是实证 一个理论 , 而是竭力去 否证 ~种猜 想。
“ 在统计检验中, 会犯无法避免的错误”这是事实。 , 但它 不是我们视而不见的理 , 而是学术懒惰的借 口。本文的宗 旨就是以单个总体均值的检验为例 , 针对如下几个问题试图 作出回答: 1 、在统计检验中, 为什么会出现错误 O与 B t 错误? 2 、分别怎样计算出现这两种错误出现的概率? 3 、如何理解 O错误和 B错误之间关系的一些命题? t 4 、统计检验为什么首先关注的是虚无假设, 而不是研
究假设 ?
虚无假设( 原假设)i 事物之问不存在差异; r: o
研究假设( 备择假设) . H: 事物之间存在差异。 在给定的显著性水平下, 当反映事物的数据之间不存在
显著性差异时, 接受” 则“ 虚无假设,拒绝” “ 研究假设 , 即认为
现象之间的差异是不存在的; 当数据之间存在差异时, 不 则“ 拒绝” 研究假设 ,拒绝” “ 虚无假设 , 即认为现象之间的差异是 存在的。 细心的读者也许察觉到了上面这段话语中用词的微 妙: 在数据没有显著性差异的时候 , 研究者可以果断地“ 拒
统计检验为科学研究特别是实证研究所提供的不仅仅
是数据处理的手段本身 , 更为重要的是 , 它可以为研究者和
绝” 研究假设而“ 接受” 原假设; , 但是 在数据存在显著性差异
的时候, 研究者却谨慎地“ 不拒绝” 研究假设。在后面这种情 况下, 为什么不干脆“ 接受” 研究假设呢? 还有
一个问题 , 研究
者的 目的是探寻事 物之间的差异 , 么把研究假设放 在原 为什
读者树立科学的观念、 端正科学的态度 、 审视研究的结果尽
到一份责任。这正是本篇论文的意义所在。
2 a 错 误 和 1 错 误 产 生 的原 因 3
O错误和 B t 错误都是相对于虚无假设而言的。 t O错误又 叫弃真的错误 , 弃真就是否定了研究总体的未知均值的真实 状态。 把实际上为真的虚无假设拒绝了。p错误又叫纳伪错 误, 纳伪就是接受 了未知的不真实状态, 把错误的虚无假设 当成了真。抽象的定义可以通过如下统计检验实例来具体
化。I l l
假设之后呢? 或者, 研究者为什么首先关心的是虚无假设呢? 也许 , 在一些研究者看来 , 以上问题似乎显得多余, 甚至有人
认 为这是统计检验 中心照不宣 的约定和共识 。然而 , 在笔者
看来 , 这些问题并非空穴来风。第一个问题与统计检验中可
能会犯两种类型的错误有关。在统计检验中, 不管研究的过 程多么完美 , 都不可避免的会犯 O错误或者 B t 错误, 当然对
一
个具体的研究而言, 只可能犯其中之一。这是我们为什么
谨慎的用“ 不拒绝” 而不是“ 接受” 的直接原因。 至于第二个问
题, 则可以用当代著名的科学哲学波普尔的“ 否证” 思想作出
基金项 目: 中国( 广西) 东盟研 究(4 K D 9 与 0S Z 0 )
例子: 一个公 司有员工 30 人( 00 研究的总体)为了检验 ,
公司员工工资统计报表的真实性 ,研究者作了 5 人的大样 0
统计与决策 20 2 下) 05年 月(
17 1
维普资讯 http://www.cqvip.com
本随机抽样调查 , 收入的调查结果是 : 人均
能是真实的。 相反, 如果结果 B 是真实的, 那么能否就此得出
A必定是真 实的结论呢?我们 的回答是不能 。如果我们这么 做 ,就会犯逻 辑学家称 之为 以推论结 果来证实 前提 的谬误 。 如果 B 是真实 的 , 我们可 以说 A也许 是真的。因为可以有许
x 样本均值)8 1 s标准差 )2 元 ( =7 元;( =1
问能否认 为统计报表 中人均 收入 I=8 x 80元的数据是 真 o 实的?( 显著性 水平 5 0 5 。 =. ) 0 研究假设 : 虚无假设 H : 。调查数 据 8 1 7 元与报表数据 80元之间没 8
多其它的前提 , 也都能推出 B之正确来。我们不能肯定 A必 定是真的, 除非我们同时还能证明不存在其他有效的备择理
论 D 使 D +。 , IB 遗憾 的是这几乎不 可能做 到。如果 B是真实 的 ,
我们 又没有 否定 A 我 们就 会 冒犯“ 而 , 纳伪 ” 的错误 的风
有显著性差异, 公司员工工资均值的真实情况为 80 8 元;
研究 假设 H :调 查数据 和报 表数 据之间有 显著性 的差 。
异, 公司员工工资均值的真实情况不是 80 8 元。
完成 以上统计检验遵循这样 的法则 :
险, 因为 A实际也许是错的。这就是 B错误出现的原因。田
对 以上两 种错误 的出现 , 我们还应作如下说 明。 首先 , 在
命题 A 大样本平均数( 的分布服从正态分布。 : x) 如果被
假设的真实情况 80元确实为真 , 样本平均数 的区间估 8 那么
C
第一次具体的检验中, 只可能犯两类错误之中的一种或没犯
错误 , 但到底是 哪种情况发生是 不知道 的。我们分析错误 的 发生是指 “ 错误 的发 生的可能性 即概率 ” 。其次 , 发生 错误
计为: ̄ . ÷ 2 16 9
V n
, 841 元- 85 2 即 7. - 8. 元; 8 8
和B 错误的前提条件是不同的。 错误发生的前提条件是虚
无假设 为真 ; 相反 , 错 误发生的前提 条件 是虚无假设为伪 。 B
命 题 B 如果在 一次抽 样调查 中 , 本 的平均 数落 在 以 : 样 上 区间之 内 , 么就认 为被 假设 的真实情 况 为真 , 那 即接 受虚 无假设 , 研究 假设 ; 拒绝 反之 , 拒绝虚无 假设 , 则 不拒绝 研究 假设 。
3 出 现 两 类 错 误 的 概 率 i- -算 i
旦了解 了统计检 验 中两种错误 发生 的原 因 , 为我们 就
命题 c 由于在这次实际的抽样调查中, : 样本的平均数 为 81 没有超出以上估计区间, 7 元, 所以, 接受虚无假设 , 拒
绝研究 假设 , 即认 为这 个公 司员工工 资的实 际平均数 为 80 8
兀 。
一
对它们出现的概率的计算奠定了基础。从前面的分析中, 我
们 知道 , 错误是 由实 际推断原理 引起 的 , 小概率事 件不 即“ 会发生 ” 的假 定所引起 的 , 以有理 由将所 有小概 率事件 发 所 生 的概 率之 和或者 即显著性 水 平 (= . ) 5 0 5看作 错误 发生 0 的概率 ,换 言之 , 错误 发生的概率 为检验所选 择的显 著性
从上 面的检验逻辑 和操 作过程 中 , 可以看到 如下两 我们 个 方面的 问题 , 正是 由于这 两个 问题 , 分别产 生 了 错误 和 B 错误 第一个 问题是 , 们只抽 了一个 样本 , 我 而个别 的样本 可 能是特殊 的 , 管你的抽样 多么符合科学抽 样的要求 。理论 不 上 讲 , 30 个员 工 中随机抽取 5 人作 为调查 样本 , 很 在
00 0 有 多种构 成样 本 的可能性 , 当于 30 选 5 , 个数 目是 很 相 00 0这 大 的。 这样 , 在理论上就有存在很 多个样本平 均数 。 样理论 抽
水平。如果是单侧检验 , 弃真错误的概率则为 5 2 /。 犯B 错误的概率的计算是比较复杂的, 由于 B错误的出 现原因是纯属逻辑上的, 所以在总体参数不知道的情况下是
无法计算它 出现概率 的大小的。
为此 , 我们在以上例子的基础上进一步设计: 这个公司 职员的实际工资不是 80 , 8 元 而是 80 虚无假设为伪 , 7 元, 仍 然假设实际工资是 80 8 元。这样我们就可以在总体均值为 80 7 元和 80 8 元两种情况下 , 分别作出两条正态分布曲线( A 线和 B , 线)见图 1 。
图1
告诉我们, 这些平均数的分布是正态的。如果真实的情况是
80 , 8 元 那么这些样本平 均数 的平均数也就是 80 。但是 , 8元
这不等于说任何一个样本的平均数都是 80 按照正态分 8 元。 布的理论, 在这些平均数中, 也有 5 %的样本平均数不在( ± X
16 . 9
V n
, 41 元-85 2元 )g 8 . 7 8 - 8. 8 f 围之 内 , 样 的事 件称 这
为小概率事件 。由于我们实 际上 只作 了一次 调查 , 只有一个
样本平均数 , 所以我们无法知道 , 这个样本平均数是否为小
概率事件 。 如果这个平均数超 出了(7 . 元一 85 2 ) 841 8 8. 元 的 8
范围, 而且是小概率事件发生的结果( 是否小概率事件我们
并不 知道 , 在操作 上 , 我们假 设 了小 概率 事件是 不发 生 的) , 那么我们必然要根据 前面提到的检验逻辑拒绝 虚无假设 。 也
就是说, 由于小概率事件的出现, 我们把本来真实的虚无假
在图 1 我们可以很清楚的看到, 中, 在理论上存在的若 干个样本均值中, 只要某个样本均值 X 841 时, .7. > 8 我们将误 认为总体均值为 80 , 8 元 也就是不拒绝虚无假设 。由于总体
的真实情 况是 80元 , 7 这样我们 就犯 了 B错误 , 即纳伪 的错
误。
设拒绝了。这就是 错误出现的原因。
第二 个问题是 , 统计检验 的逻辑犯 了从结 论推断前提 的
错误。命题 B 是由命题 A经演绎推论出来的,或写作符号 A , —B 命题 C是我们在检验中所依据操作法则。 如果 A是真
的, 且我们从 A到 B的演绎推论如果也是正确的, 那么 B可
犯B 错误的概率大小就是相对正态曲线 A而言,图 1 中阴影部分的面积 :
1 8
统计 与决策 20 1 05年 2月( ) 下
维普资讯 http://www.cqvip.com
Z l 141 ; Z 2 5 5 x= . x .9 =
论 。】 果笔者的判断没有错误 的话 , 的“ 女 口 他 否证 ” 想主要受 思 到了爱 因斯 坦理论 , 准确 的说 是爱 因斯坦 广义相对论 的命运 的影 响。我们知道 , 因斯坦 的广义相 对论发表 于 11 年 , 爱 95 刚开 始 , 人们无法 用实验或者观察来实证 它的正确性。 为此 , 爱因斯坦声称 :如果广义相对论 是对 的, “ 那么光线通 过引力
查标准正态分布表可知, -, 一 z )0 73 3 tZ 1 c( ) ( = . 9 0 结果表明,如果总体的真值为 80 ,而虚无假设为 7元 80 8 元的话, 那么 , 平均而言每 10次抽样中, 0 将约有 8 次把 真实情况当作 80 8 元被接受 ,即犯 B错误的概率大小是
00 9 .7 3。
场时, 就会发生弯曲。 反言之 , ” 如果实证资料表明, 光线通
过 引力场时 没有发生 弯曲 , 那么理 论就是错 误 的。11 年 , 99 英国皇家学 会 和皇家天文学会利用 全 日 的机 会 , 量出太 食 测
和前面几个命题联系起来看, B错误确实是逻辑上的谬
误所致 , 因为不 同的样本 均值 ( 统计结果 ) 以对 应 同一个假 可 设前提 ( 虚无假设 ) 。
阳附近( 一个很强大的引力场) 的光线是弯曲的。 l , 从此 爱因
斯坦的广义相对论才被逐 渐科 学界所认可 。 处在这个时代并
4 对 相 关 命 墨 的 说 n! / 命题 1在统计检验中, : 在样本容量一定的条件下, 错 误和 B错误不可能同时减小。 这个命题可以借助前面的图形
1 来理解 ,一旦正态分布 A的拒绝域 减小 即 错误 减小 , 则 ( 叉) X一 这个 区域将 增 大 , 图 A上 阴影 部 分 的面积 ( 而 B错
误) 也将增 大 。
拜会过爱因斯坦的波普尔不会不知道这个经典的科学故事。
他显然受到这个 事件 的启 发 : 的正确性 和是否存在实证 理论
的观察没有关系, 因为即使没有天文资料 , 爱因斯坦的理论 也是对的。 换言之, 能否被经验的事实所证实, 并不是衡量理
论 的科学性 的标准 。在这样 的起点上 , 尔的思想走 的更 波普
远。认为即使理论被一个有限的经验所证实, 也不能肯定其
在任何 条件 下正确 , 因为归纳 法的作用是有 限的 : 理论 , 一个
一
命题 2 真实的总体参数( 与假设 的总体参数( 之 : ) ) 间的差异( ) △ 越小 , B错误的概率越大。这个命题也可 犯
以从
图形 1 得到说 明。因为 △ 越小 , 两个正态 图就相距 越 近, 阴影部分面积就增大 。
万次被证实. 不能说明它的正确; 相反, 一次否证就完全可
以摧毁整个理论大厦。 在这样的逻辑下, - 习 波普尔决心与传统
的实证主义分道扬镳 , 出“ 提 否证 ” 才是 评判理论科学性 的标
准。
命题 3犯 错误的概率和犯 B错误的概率之和不为 1 : 。 错误的概率是在图 A上被指示的显著性水平的大小, B 而 错误的概率是图 A上阴影部分的面积。既然假设的总体均 值并不与真值相等 ( 这是错 B 误产生的前提) ,图 A与图 B 就不可能重合, 因此 和之 B和不可能为 1 5 虚 无 假 设 优 先 -- 究 假 设 — — 统 计 检 验 q研 ' V
中的否证思想
确实探寻事 物之间差异 的存 在是研究 的 目的 , 我们 也是
的研究假设, 但是, 在研究的策略上, 我们必须以差异的不存 在作为出发点。 所以我们把虚无假设放在较研究假设更为优 先的地位, 这与从波普尔的“ 否证” 思想不谋而合。这个问题 的另一方面还在于,即使统计检验的结果表明差异是显著
的, 我们也不能草率地“ 接受” 研究假设, 充其量 , 我们只能
“ 不拒绝” 研究 假设 。这不仅仅是 因为有 B错误 出现 的可能 , 而且 , “ 按照 否证 ” 想 的精神 , 的正确性都是相 对的 , 思 理论 暂 时正确的理论 , 被更为有效的理论所否证 。1 必将 6 ]
在假设检验中, 我们把“ 不存在显著性差异” 作为首先要
检验 的假设 , 而且 , 于检验的结果 , 对 如果统 计上不存 在显 著
参考文献 :
性差异 , 就果断“ 接受” 而不是“ 不拒绝” 虚无假设。为什么要
首先考虑的是虚无假设 呢?
[ P淑华. 1 l 社会统计 M . 】 北京: 北京大学出版社, 9 、 18 9
[ 2 儿美】 莱洛 克. 统 计 学[ . 元 等译 . 布 社会 M】 沈德 北京 : 学 出版社 , 科
1 87 9 .
在科学史上, 一些重要的研究假设其实都是以否定的形 式提出的。 例如, 热力学就是以不存在永动机为前提的; 爱因 斯坦的相对论的基本假设就是不存在绝对运动等。 当代著名 的科学哲学家波普尔发现了这一点, 并提出了“ 否证” 思想。 那么, 什么是“ 否证”呢? 它反映了波普尔关于科学划界
[ [ 渡普尔. 3 英】 】 客观知识[】 M. 舒炜光等译、 上海: 上海译文出版社, O 2 l O
[ [ 克威利克' 因斯坦与相对论[ 】 文华译. : 4  ̄1 1 爱 M. 赵 北京 商务印书
馆 ,
19 . 9 4
●
[】 尔. 穷的探 索[】 5波普 无 M、 邱仁宗译. : 南京 江苏人 民出版社 ,00 20 . 、 [ [ 彭加 勒. 学的 价值 [】 醒民 译. 阳 : 宁教 育 出版 社 , 6 法】 】 科 M. 李 沈 辽
∞ 0.
问题中的重要思想。波普尔自己承认 , 他的哲学思想的来源
有三 : 马克思 主义 , 一是 二是弗洛伊德 学说 , 三是爱因斯 坦理
( 任编辑/ 责 李友 平)
统计与决策 20 年 2 ( 05 月 下)
19 1
维普资讯 http://www.cqvip.com
假设检验中两类错误的成因 发生概率及其相关问题
以单个总体均值检验为例
李文华, 雷金星
( 广西师范大学 政管学院,广西 桂林 5 10 ) 40 1
摘
要: 本文以单个均值检验为例, 首先分析了统计检验 中两类理论错误发生的原因: 错误由 O t
实际推断原理引起; 错误 由逻辑谬误引起; p 之后, 分别计算了它们发生的概率大小并与之相关的问
题做 出了解释 ; 此基础上 , 在 笔者简要说 明了“ 否证” 思想在 实证研 究 中的合理性。 关键词 : 两类错误 ; 因; 原 概率 ;否证 ” “
中图分类号:2 0 1
文献标识码: A
文章编号:02 68( 0)20 — 3 10 —47 05 - 17 0 2 0 1
解释 , 这种解释是 相关解释 而不 是因果解 释。这 种思想认为
1 问 题 的 缘 起 如果运用定量的方法来研究社会现象之间是否存在差 异, 需要借助统计学中假设检验这个手段。统计检验的假设 形式为:
科学研究 的 目的不是实证 一个理论 , 而是竭力去 否证 ~种猜 想。
“ 在统计检验中, 会犯无法避免的错误”这是事实。 , 但它 不是我们视而不见的理 , 而是学术懒惰的借 口。本文的宗 旨就是以单个总体均值的检验为例 , 针对如下几个问题试图 作出回答: 1 、在统计检验中, 为什么会出现错误 O与 B t 错误? 2 、分别怎样计算出现这两种错误出现的概率? 3 、如何理解 O错误和 B错误之间关系的一些命题? t 4 、统计检验为什么首先关注的是虚无假设, 而不是研
究假设 ?
虚无假设( 原假设)i 事物之问不存在差异; r: o
研究假设( 备择假设) . H: 事物之间存在差异。 在给定的显著性水平下, 当反映事物的数据之间不存在
显著性差异时, 接受” 则“ 虚无假设,拒绝” “ 研究假设 , 即认为
现象之间的差异是不存在的; 当数据之间存在差异时, 不 则“ 拒绝” 研究假设 ,拒绝” “ 虚无假设 , 即认为现象之间的差异是 存在的。 细心的读者也许察觉到了上面这段话语中用词的微 妙: 在数据没有显著性差异的时候 , 研究者可以果断地“ 拒
统计检验为科学研究特别是实证研究所提供的不仅仅
是数据处理的手段本身 , 更为重要的是 , 它可以为研究者和
绝” 研究假设而“ 接受” 原假设; , 但是 在数据存在显著性差异
的时候, 研究者却谨慎地“ 不拒绝” 研究假设。在后面这种情 况下, 为什么不干脆“ 接受” 研究假设呢? 还有
一个问题 , 研究
者的 目的是探寻事 物之间的差异 , 么把研究假设放 在原 为什
读者树立科学的观念、 端正科学的态度 、 审视研究的结果尽
到一份责任。这正是本篇论文的意义所在。
2 a 错 误 和 1 错 误 产 生 的原 因 3
O错误和 B t 错误都是相对于虚无假设而言的。 t O错误又 叫弃真的错误 , 弃真就是否定了研究总体的未知均值的真实 状态。 把实际上为真的虚无假设拒绝了。p错误又叫纳伪错 误, 纳伪就是接受 了未知的不真实状态, 把错误的虚无假设 当成了真。抽象的定义可以通过如下统计检验实例来具体
化。I l l
假设之后呢? 或者, 研究者为什么首先关心的是虚无假设呢? 也许 , 在一些研究者看来 , 以上问题似乎显得多余, 甚至有人
认 为这是统计检验 中心照不宣 的约定和共识 。然而 , 在笔者
看来 , 这些问题并非空穴来风。第一个问题与统计检验中可
能会犯两种类型的错误有关。在统计检验中, 不管研究的过 程多么完美 , 都不可避免的会犯 O错误或者 B t 错误, 当然对
一
个具体的研究而言, 只可能犯其中之一。这是我们为什么
谨慎的用“ 不拒绝” 而不是“ 接受” 的直接原因。 至于第二个问
题, 则可以用当代著名的科学哲学波普尔的“ 否证” 思想作出
基金项 目: 中国( 广西) 东盟研 究(4 K D 9 与 0S Z 0 )
例子: 一个公 司有员工 30 人( 00 研究的总体)为了检验 ,
公司员工工资统计报表的真实性 ,研究者作了 5 人的大样 0
统计与决策 20 2 下) 05年 月(
17 1
维普资讯 http://www.cqvip.com
本随机抽样调查 , 收入的调查结果是 : 人均
能是真实的。 相反, 如果结果 B 是真实的, 那么能否就此得出
A必定是真 实的结论呢?我们 的回答是不能 。如果我们这么 做 ,就会犯逻 辑学家称 之为 以推论结 果来证实 前提 的谬误 。 如果 B 是真实 的 , 我们可 以说 A也许 是真的。因为可以有许
x 样本均值)8 1 s标准差 )2 元 ( =7 元;( =1
问能否认 为统计报表 中人均 收入 I=8 x 80元的数据是 真 o 实的?( 显著性 水平 5 0 5 。 =. ) 0 研究假设 : 虚无假设 H : 。调查数 据 8 1 7 元与报表数据 80元之间没 8
多其它的前提 , 也都能推出 B之正确来。我们不能肯定 A必 定是真的, 除非我们同时还能证明不存在其他有效的备择理
论 D 使 D +。 , IB 遗憾 的是这几乎不 可能做 到。如果 B是真实 的 ,
我们 又没有 否定 A 我 们就 会 冒犯“ 而 , 纳伪 ” 的错误 的风
有显著性差异, 公司员工工资均值的真实情况为 80 8 元;
研究 假设 H :调 查数据 和报 表数 据之间有 显著性 的差 。
异, 公司员工工资均值的真实情况不是 80 8 元。
完成 以上统计检验遵循这样 的法则 :
险, 因为 A实际也许是错的。这就是 B错误出现的原因。田
对 以上两 种错误 的出现 , 我们还应作如下说 明。 首先 , 在
命题 A 大样本平均数( 的分布服从正态分布。 : x) 如果被
假设的真实情况 80元确实为真 , 样本平均数 的区间估 8 那么
C
第一次具体的检验中, 只可能犯两类错误之中的一种或没犯
错误 , 但到底是 哪种情况发生是 不知道 的。我们分析错误 的 发生是指 “ 错误 的发 生的可能性 即概率 ” 。其次 , 发生 错误
计为: ̄ . ÷ 2 16 9
V n
, 841 元- 85 2 即 7. - 8. 元; 8 8
和B 错误的前提条件是不同的。 错误发生的前提条件是虚
无假设 为真 ; 相反 , 错 误发生的前提 条件 是虚无假设为伪 。 B
命 题 B 如果在 一次抽 样调查 中 , 本 的平均 数落 在 以 : 样 上 区间之 内 , 么就认 为被 假设 的真实情 况 为真 , 那 即接 受虚 无假设 , 研究 假设 ; 拒绝 反之 , 拒绝虚无 假设 , 则 不拒绝 研究 假设 。
3 出 现 两 类 错 误 的 概 率 i- -算 i
旦了解 了统计检 验 中两种错误 发生 的原 因 , 为我们 就
命题 c 由于在这次实际的抽样调查中, : 样本的平均数 为 81 没有超出以上估计区间, 7 元, 所以, 接受虚无假设 , 拒
绝研究 假设 , 即认 为这 个公 司员工工 资的实 际平均数 为 80 8
兀 。
一
对它们出现的概率的计算奠定了基础。从前面的分析中, 我
们 知道 , 错误是 由实 际推断原理 引起 的 , 小概率事 件不 即“ 会发生 ” 的假 定所引起 的 , 以有理 由将所 有小概 率事件 发 所 生 的概 率之 和或者 即显著性 水 平 (= . ) 5 0 5看作 错误 发生 0 的概率 ,换 言之 , 错误 发生的概率 为检验所选 择的显 著性
从上 面的检验逻辑 和操 作过程 中 , 可以看到 如下两 我们 个 方面的 问题 , 正是 由于这 两个 问题 , 分别产 生 了 错误 和 B 错误 第一个 问题是 , 们只抽 了一个 样本 , 我 而个别 的样本 可 能是特殊 的 , 管你的抽样 多么符合科学抽 样的要求 。理论 不 上 讲 , 30 个员 工 中随机抽取 5 人作 为调查 样本 , 很 在
00 0 有 多种构 成样 本 的可能性 , 当于 30 选 5 , 个数 目是 很 相 00 0这 大 的。 这样 , 在理论上就有存在很 多个样本平 均数 。 样理论 抽
水平。如果是单侧检验 , 弃真错误的概率则为 5 2 /。 犯B 错误的概率的计算是比较复杂的, 由于 B错误的出 现原因是纯属逻辑上的, 所以在总体参数不知道的情况下是
无法计算它 出现概率 的大小的。
为此 , 我们在以上例子的基础上进一步设计: 这个公司 职员的实际工资不是 80 , 8 元 而是 80 虚无假设为伪 , 7 元, 仍 然假设实际工资是 80 8 元。这样我们就可以在总体均值为 80 7 元和 80 8 元两种情况下 , 分别作出两条正态分布曲线( A 线和 B , 线)见图 1 。
图1
告诉我们, 这些平均数的分布是正态的。如果真实的情况是
80 , 8 元 那么这些样本平 均数 的平均数也就是 80 。但是 , 8元
这不等于说任何一个样本的平均数都是 80 按照正态分 8 元。 布的理论, 在这些平均数中, 也有 5 %的样本平均数不在( ± X
16 . 9
V n
, 41 元-85 2元 )g 8 . 7 8 - 8. 8 f 围之 内 , 样 的事 件称 这
为小概率事件 。由于我们实 际上 只作 了一次 调查 , 只有一个
样本平均数 , 所以我们无法知道 , 这个样本平均数是否为小
概率事件 。 如果这个平均数超 出了(7 . 元一 85 2 ) 841 8 8. 元 的 8
范围, 而且是小概率事件发生的结果( 是否小概率事件我们
并不 知道 , 在操作 上 , 我们假 设 了小 概率 事件是 不发 生 的) , 那么我们必然要根据 前面提到的检验逻辑拒绝 虚无假设 。 也
就是说, 由于小概率事件的出现, 我们把本来真实的虚无假
在图 1 我们可以很清楚的看到, 中, 在理论上存在的若 干个样本均值中, 只要某个样本均值 X 841 时, .7. > 8 我们将误 认为总体均值为 80 , 8 元 也就是不拒绝虚无假设 。由于总体
的真实情 况是 80元 , 7 这样我们 就犯 了 B错误 , 即纳伪 的错
误。
设拒绝了。这就是 错误出现的原因。
第二 个问题是 , 统计检验 的逻辑犯 了从结 论推断前提 的
错误。命题 B 是由命题 A经演绎推论出来的,或写作符号 A , —B 命题 C是我们在检验中所依据操作法则。 如果 A是真
的, 且我们从 A到 B的演绎推论如果也是正确的, 那么 B可
犯B 错误的概率大小就是相对正态曲线 A而言,图 1 中阴影部分的面积 :
1 8
统计 与决策 20 1 05年 2月( ) 下
维普资讯 http://www.cqvip.com
Z l 141 ; Z 2 5 5 x= . x .9 =
论 。】 果笔者的判断没有错误 的话 , 的“ 女 口 他 否证 ” 想主要受 思 到了爱 因斯 坦理论 , 准确 的说 是爱 因斯坦 广义相对论 的命运 的影 响。我们知道 , 因斯坦 的广义相 对论发表 于 11 年 , 爱 95 刚开 始 , 人们无法 用实验或者观察来实证 它的正确性。 为此 , 爱因斯坦声称 :如果广义相对论 是对 的, “ 那么光线通 过引力
查标准正态分布表可知, -, 一 z )0 73 3 tZ 1 c( ) ( = . 9 0 结果表明,如果总体的真值为 80 ,而虚无假设为 7元 80 8 元的话, 那么 , 平均而言每 10次抽样中, 0 将约有 8 次把 真实情况当作 80 8 元被接受 ,即犯 B错误的概率大小是
00 9 .7 3。
场时, 就会发生弯曲。 反言之 , ” 如果实证资料表明, 光线通
过 引力场时 没有发生 弯曲 , 那么理 论就是错 误 的。11 年 , 99 英国皇家学 会 和皇家天文学会利用 全 日 的机 会 , 量出太 食 测
和前面几个命题联系起来看, B错误确实是逻辑上的谬
误所致 , 因为不 同的样本 均值 ( 统计结果 ) 以对 应 同一个假 可 设前提 ( 虚无假设 ) 。
阳附近( 一个很强大的引力场) 的光线是弯曲的。 l , 从此 爱因
斯坦的广义相对论才被逐 渐科 学界所认可 。 处在这个时代并
4 对 相 关 命 墨 的 说 n! / 命题 1在统计检验中, : 在样本容量一定的条件下, 错 误和 B错误不可能同时减小。 这个命题可以借助前面的图形
1 来理解 ,一旦正态分布 A的拒绝域 减小 即 错误 减小 , 则 ( 叉) X一 这个 区域将 增 大 , 图 A上 阴影 部 分 的面积 ( 而 B错
误) 也将增 大 。
拜会过爱因斯坦的波普尔不会不知道这个经典的科学故事。
他显然受到这个 事件 的启 发 : 的正确性 和是否存在实证 理论
的观察没有关系, 因为即使没有天文资料 , 爱因斯坦的理论 也是对的。 换言之, 能否被经验的事实所证实, 并不是衡量理
论 的科学性 的标准 。在这样 的起点上 , 尔的思想走 的更 波普
远。认为即使理论被一个有限的经验所证实, 也不能肯定其
在任何 条件 下正确 , 因为归纳 法的作用是有 限的 : 理论 , 一个
一
命题 2 真实的总体参数( 与假设 的总体参数( 之 : ) ) 间的差异( ) △ 越小 , B错误的概率越大。这个命题也可 犯
以从
图形 1 得到说 明。因为 △ 越小 , 两个正态 图就相距 越 近, 阴影部分面积就增大 。
万次被证实. 不能说明它的正确; 相反, 一次否证就完全可
以摧毁整个理论大厦。 在这样的逻辑下, - 习 波普尔决心与传统
的实证主义分道扬镳 , 出“ 提 否证 ” 才是 评判理论科学性 的标
准。
命题 3犯 错误的概率和犯 B错误的概率之和不为 1 : 。 错误的概率是在图 A上被指示的显著性水平的大小, B 而 错误的概率是图 A上阴影部分的面积。既然假设的总体均 值并不与真值相等 ( 这是错 B 误产生的前提) ,图 A与图 B 就不可能重合, 因此 和之 B和不可能为 1 5 虚 无 假 设 优 先 -- 究 假 设 — — 统 计 检 验 q研 ' V
中的否证思想
确实探寻事 物之间差异 的存 在是研究 的 目的 , 我们 也是
的研究假设, 但是, 在研究的策略上, 我们必须以差异的不存 在作为出发点。 所以我们把虚无假设放在较研究假设更为优 先的地位, 这与从波普尔的“ 否证” 思想不谋而合。这个问题 的另一方面还在于,即使统计检验的结果表明差异是显著
的, 我们也不能草率地“ 接受” 研究假设, 充其量 , 我们只能
“ 不拒绝” 研究 假设 。这不仅仅是 因为有 B错误 出现 的可能 , 而且 , “ 按照 否证 ” 想 的精神 , 的正确性都是相 对的 , 思 理论 暂 时正确的理论 , 被更为有效的理论所否证 。1 必将 6 ]
在假设检验中, 我们把“ 不存在显著性差异” 作为首先要
检验 的假设 , 而且 , 于检验的结果 , 对 如果统 计上不存 在显 著
参考文献 :
性差异 , 就果断“ 接受” 而不是“ 不拒绝” 虚无假设。为什么要
首先考虑的是虚无假设 呢?
[ P淑华. 1 l 社会统计 M . 】 北京: 北京大学出版社, 9 、 18 9
[ 2 儿美】 莱洛 克. 统 计 学[ . 元 等译 . 布 社会 M】 沈德 北京 : 学 出版社 , 科
1 87 9 .
在科学史上, 一些重要的研究假设其实都是以否定的形 式提出的。 例如, 热力学就是以不存在永动机为前提的; 爱因 斯坦的相对论的基本假设就是不存在绝对运动等。 当代著名 的科学哲学家波普尔发现了这一点, 并提出了“ 否证” 思想。 那么, 什么是“ 否证”呢? 它反映了波普尔关于科学划界
[ [ 渡普尔. 3 英】 】 客观知识[】 M. 舒炜光等译、 上海: 上海译文出版社, O 2 l O
[ [ 克威利克' 因斯坦与相对论[ 】 文华译. : 4  ̄1 1 爱 M. 赵 北京 商务印书
馆 ,
19 . 9 4
●
[】 尔. 穷的探 索[】 5波普 无 M、 邱仁宗译. : 南京 江苏人 民出版社 ,00 20 . 、 [ [ 彭加 勒. 学的 价值 [】 醒民 译. 阳 : 宁教 育 出版 社 , 6 法】 】 科 M. 李 沈 辽
∞ 0.
问题中的重要思想。波普尔自己承认 , 他的哲学思想的来源
有三 : 马克思 主义 , 一是 二是弗洛伊德 学说 , 三是爱因斯 坦理
( 任编辑/ 责 李友 平)
统计与决策 20 年 2 ( 05 月 下)
19 1