数理统计中的几种统计推断方法

数理统计中的几种统计推断方法

——导学文章之九

数理统计的基本问题是根据样本所提供的信息,对总体的分布以及分布的数字特征作出统计推断。统计推断的主要内容分为两大类:一是参数估计问题,另一类是假设检验问题。

本篇文章主要讨论总体参数的点估计、区间估计和假设检验。 一、点估计

1、矩估计

首先讲“矩”的概念,

定义:设X是随机变量,k是一正整数,若EXk存在,则称EXk为随机变量X的k阶原点矩,记为ak;若存在,则称它为X的k阶中心矩,记为bk。

显然,数学期望EX就是1阶原点矩,方差DX就是2阶中心矩。 简单的说就是用样本矩去估计相应的总体矩,用样本矩的连续函数去估计相应的总体矩的连续函数。矩估计法的理论基础是大数定理。因为大数定理告诉我们样本矩依概率收敛于总体的相应矩,样本矩的连续函数依概率收敛于相应总体矩的连续函数。

我们通常样本的均值X去估计总体的均值EX:即总体为X时,我们从中取出n个样本X1,X2, Xn,我们认为总体的均值就是X=种估计,当然会有误差)

当EX存在的时候,我们通常用

2

1

n

∑n

Xi

,(当然这只是对总体均值的一

i=1

1

n

∑n

Xi

2

作为总体X的EX2的估计

1

n

i

i=1

一般地,我们用

E(X-EX)

k

1

n

∑n

Xi

k

作为总体X的EX的估计,用

k

i=1

(X∑n

i=1

-X)

k

作为总体的

的估计。

例:设总体X在[a,b]上服从均匀分布,参数a,b未知,X1,X2, Xn是一个样本,求a,b的矩估计量。

解:由矩估计法知道:EX=

2

2

a+b2

2

2

由于DX=EX-(EX),因此EX=DX+(EX)=

1

n

(b-a)121

n

2

+

(a+b)

4

2

用矩估计法,也即用X=

∑n

Xi

作为EX的估计,用

i=1

∑n

Xi

2

作为EX2的估计,

i=1

为了计算方便,我们记A1=

a+b2

1

n

∑n

i=1

Xi

,记A2=

2

1

n

∑n

Xi

2

i=1

即有

=A1,EX

2

=

(b-a)12

2

+

(a+b)

4

=A2

⎧⎪a+b=2A1

解得,⎨⎪⎩b-a=再联立解关于a,b的方程组得a,b的矩估计量分别为

=A-a1

=X-

=A+b1

=X+

2、极大似然估计

⑴ 对于连续型总体X,设它的密度函数为f(x;θ1,θ2, θm),其中θ1,θ2, θm是需要估计的未知参数。

设X1,X2, Xn是来自总体X的一个样本,则X1,X2, Xn的联合密度函数为:

n

i=1

f(xi;θ1,θ2, θm)

对于给定的一组样本值x1,x2, xn,记联合密度

n

L=L(x1,x2, xn;θ1,θ2, θm)=∏f(xi;θ1,θ2, θm)

i=1

则称L为样本的似然函数

⑵ 若X为离散型总体,它的概率分布为: P{X=x}=p(x;θ1,θ2, θm)

对于给定的一组样本观测值x1,x2, xn,记联合密度

n

L=L(x1,x2, xn;θ1,θ2, θm)=∏p(xi;θ1,θ2, θm)

i=1

则称L为样本的似然函数 ⑶ 具体求法

对于已经给定的样本观测值x1,x2, xn来说,似然函数L是关于待估计的参数

θ1,θ2, θm的函数,因此我们应该想办法通过似然函数L求出参数θ1,θ2, θm值。

这里我们求法的思想来源于多元函数求极大值:

也即,我们把L=L(x1,x2, xn;θ1,θ2, θm)看作关于θ1,θ2, θm的多元函数,我们要求得适当的θ1,θ2, θm的值,使得L=L(x1,x2, xn;θ1,θ2, θm)取最大值。

解释:实际上L=L(x1,x2, xn;θ1,θ2, θm)表示随机变量X1,X2, Xn取得样本值我们在一次试验中事件(X1,X2, Xn)=(x1,x2, xn)已经发生,x1,x2, xn时的联合概率,

我们就有理由认为,参数必须保证此时的概率最大,也即:参数(θ1,θ2, θm)的值应该是使得L=L(x1,x2, xn;θ1,θ2, θm)最大的点。

这样我们的方法就是多元函数求极大值的方法。

极大似然估计的具体步骤为:

① 求出似然函数L=L(x1,x2, xn;θ1,θ2, θm);

② 计算关于(θ1,θ2, θm)的函数L=L(x1,x2, xn;θ1,θ2, θm)的极大值点, 我们由微积分的知识知道,实际问题中的极大值点就是函数的驻点,也就是每个偏导数都为0的点,即

⎧∂L

⎪∂θ=0⎪1⎪∂L

=0⎪∂θ ⎨2⎪ ⎪⎪∂L

⎪∂θ=0⎩n

(一般称该方程组为似然方程组)

但是在实际计算中,由于L=L(x1,x2, xn;θ1,θ2, θm)都是乘积,因此以上方程组求解不太容易,这时候我们由微积分的知识知道到函数L=L(x1,x2, xn;θ1,θ2, θm)和它的对数函数lnL=lnL(x1,x2, xn;θ1,θ2, θm)有相同的极大值点,因此我把问题转化为求

lnL=lnL(x1,x2, xn;θ1,θ2, θm)的极大值点,这样把乘积问题转化为了和差问题,在某

些复杂问题中可以大大减轻计算!

⎧∂lnL⎪∂θ=0

1

⎪∂lnL

=0⎪

⎨∂θ2⎪ ⎪

⎪∂lnL

=0⎪∂θm⎩

(一般称该方程组为对数似然方程组)

求解这个方程组即得到

,θ , θ )就是参数(θ,θ, θ)的估计值。 ③ 上个步骤求出的(θ12m12m

二、区间估计

(X,X, X)是随机变量,无论这个估计量的性由于总体的未知参数θ的估计量θ12n

质有多好,通过一个样本值(x1,x2, xn)所得到的估计值,只能是未知参数θ的近似值,而不是θ的真值。并且样本值不同所得到的估计值也不同。那么θ的真值在什么范围内

呢?能不能通过样本,寻找一个区间,以一定的把握包含总体未知参数θ呢?这就是总体未知参数的区间估计问题。

区间估计严格的定义为: 定义:设总体X的分布函数F(x,θ)含有一个未知参数θ,对于给定值α(0

1(X,X, X)和θ (X,X, X)满足 由样本(X1,X2, Xn)确定的两个的两个统计量θ12n12n 1(X,X, X)

1,θ 2)是参数θ的置信度为1-α的置信区间, 1和θ 2分别趁称为置信度为则称随机区间(θθ

1-α的双侧置信区间的置信下限和置信上限,1-α称为置信度。

单个正态总体的的数学期望和方差的区间估计是我们重点要求掌握的知识点,大家

可以好好阅读教材第189—198面,实际上课本把这种区间估计分各种情形的结论总结成了第209面的表格。大家在理解这些区间估计的实质后,应该把表格的结论和公式记住,往往在实际解题的时候我们只需要套用这些结论就可以了! 三、假设检验

所谓假设检验,顾名思义就是先假设再检验,实际上有点类似于反证法,在实际问题中我们往往需要对未知总体提出某中假设或推断,但是我们的假设可能是错的,也可能是正确的,这时候我们就需要利用一个抽样的样本(x1,x2, xn),通过一定的方法,检验这个假设是否合理,从而作出接受或者拒绝这个假设的结论。

假设检验的基本原理是——小概率事件原理,也即:我们认为小概率事件在一次试验中几乎不可能发生,如果我们在抽取的样本观测值(x1,x2, xn)下,居然使得小概率事件发生了,我们就有理由否定原假设。

在明确一个假设检验问题的性质与基本前提(包括分布类型是否已知,如果类型已

知,分布中包含哪些未知参数等等)之后,假设检验的一般步骤如下:

⑴ 充分考虑和利用已知的背景知识提出原假设H0以及对立假设H1;

⑵ 给定样本,确定合适的检验统计量,并在H0为真下导出统计量的分布(要求此分布不依赖与任何未知参数);

⑶ 确定拒绝域:即依直观分析先确定拒绝域的形式,然后根据给定的显著性水平α和以上统计量的分布由条件概率P{拒绝H0|H0为真}=α确定拒绝域的临界值,从而确定拒绝域;

⑷ 作出判断:由一次具体抽样的样本值计算统计量的值,若统计量的值落入以上拒绝域,则拒绝H0;否则接受H0。

我们重点研究单个正态总体数学期望和方差的假设,两个正态总体均值差和方差比的假设检验,教材分别给出了每种不同类型所用的统计量以及基本步骤(见教材第221—250面)。对不同类型的问题,大家现在应该模仿教材的解法套出一些题目。

在实际解题的时候我们需要注意以下问题: ① 不同类型所用的统计量;

② 用到的统计量中的自由度,以便于查表。

数理统计中的几种统计推断方法

——导学文章之九

数理统计的基本问题是根据样本所提供的信息,对总体的分布以及分布的数字特征作出统计推断。统计推断的主要内容分为两大类:一是参数估计问题,另一类是假设检验问题。

本篇文章主要讨论总体参数的点估计、区间估计和假设检验。 一、点估计

1、矩估计

首先讲“矩”的概念,

定义:设X是随机变量,k是一正整数,若EXk存在,则称EXk为随机变量X的k阶原点矩,记为ak;若存在,则称它为X的k阶中心矩,记为bk。

显然,数学期望EX就是1阶原点矩,方差DX就是2阶中心矩。 简单的说就是用样本矩去估计相应的总体矩,用样本矩的连续函数去估计相应的总体矩的连续函数。矩估计法的理论基础是大数定理。因为大数定理告诉我们样本矩依概率收敛于总体的相应矩,样本矩的连续函数依概率收敛于相应总体矩的连续函数。

我们通常样本的均值X去估计总体的均值EX:即总体为X时,我们从中取出n个样本X1,X2, Xn,我们认为总体的均值就是X=种估计,当然会有误差)

当EX存在的时候,我们通常用

2

1

n

∑n

Xi

,(当然这只是对总体均值的一

i=1

1

n

∑n

Xi

2

作为总体X的EX2的估计

1

n

i

i=1

一般地,我们用

E(X-EX)

k

1

n

∑n

Xi

k

作为总体X的EX的估计,用

k

i=1

(X∑n

i=1

-X)

k

作为总体的

的估计。

例:设总体X在[a,b]上服从均匀分布,参数a,b未知,X1,X2, Xn是一个样本,求a,b的矩估计量。

解:由矩估计法知道:EX=

2

2

a+b2

2

2

由于DX=EX-(EX),因此EX=DX+(EX)=

1

n

(b-a)121

n

2

+

(a+b)

4

2

用矩估计法,也即用X=

∑n

Xi

作为EX的估计,用

i=1

∑n

Xi

2

作为EX2的估计,

i=1

为了计算方便,我们记A1=

a+b2

1

n

∑n

i=1

Xi

,记A2=

2

1

n

∑n

Xi

2

i=1

即有

=A1,EX

2

=

(b-a)12

2

+

(a+b)

4

=A2

⎧⎪a+b=2A1

解得,⎨⎪⎩b-a=再联立解关于a,b的方程组得a,b的矩估计量分别为

=A-a1

=X-

=A+b1

=X+

2、极大似然估计

⑴ 对于连续型总体X,设它的密度函数为f(x;θ1,θ2, θm),其中θ1,θ2, θm是需要估计的未知参数。

设X1,X2, Xn是来自总体X的一个样本,则X1,X2, Xn的联合密度函数为:

n

i=1

f(xi;θ1,θ2, θm)

对于给定的一组样本值x1,x2, xn,记联合密度

n

L=L(x1,x2, xn;θ1,θ2, θm)=∏f(xi;θ1,θ2, θm)

i=1

则称L为样本的似然函数

⑵ 若X为离散型总体,它的概率分布为: P{X=x}=p(x;θ1,θ2, θm)

对于给定的一组样本观测值x1,x2, xn,记联合密度

n

L=L(x1,x2, xn;θ1,θ2, θm)=∏p(xi;θ1,θ2, θm)

i=1

则称L为样本的似然函数 ⑶ 具体求法

对于已经给定的样本观测值x1,x2, xn来说,似然函数L是关于待估计的参数

θ1,θ2, θm的函数,因此我们应该想办法通过似然函数L求出参数θ1,θ2, θm值。

这里我们求法的思想来源于多元函数求极大值:

也即,我们把L=L(x1,x2, xn;θ1,θ2, θm)看作关于θ1,θ2, θm的多元函数,我们要求得适当的θ1,θ2, θm的值,使得L=L(x1,x2, xn;θ1,θ2, θm)取最大值。

解释:实际上L=L(x1,x2, xn;θ1,θ2, θm)表示随机变量X1,X2, Xn取得样本值我们在一次试验中事件(X1,X2, Xn)=(x1,x2, xn)已经发生,x1,x2, xn时的联合概率,

我们就有理由认为,参数必须保证此时的概率最大,也即:参数(θ1,θ2, θm)的值应该是使得L=L(x1,x2, xn;θ1,θ2, θm)最大的点。

这样我们的方法就是多元函数求极大值的方法。

极大似然估计的具体步骤为:

① 求出似然函数L=L(x1,x2, xn;θ1,θ2, θm);

② 计算关于(θ1,θ2, θm)的函数L=L(x1,x2, xn;θ1,θ2, θm)的极大值点, 我们由微积分的知识知道,实际问题中的极大值点就是函数的驻点,也就是每个偏导数都为0的点,即

⎧∂L

⎪∂θ=0⎪1⎪∂L

=0⎪∂θ ⎨2⎪ ⎪⎪∂L

⎪∂θ=0⎩n

(一般称该方程组为似然方程组)

但是在实际计算中,由于L=L(x1,x2, xn;θ1,θ2, θm)都是乘积,因此以上方程组求解不太容易,这时候我们由微积分的知识知道到函数L=L(x1,x2, xn;θ1,θ2, θm)和它的对数函数lnL=lnL(x1,x2, xn;θ1,θ2, θm)有相同的极大值点,因此我把问题转化为求

lnL=lnL(x1,x2, xn;θ1,θ2, θm)的极大值点,这样把乘积问题转化为了和差问题,在某

些复杂问题中可以大大减轻计算!

⎧∂lnL⎪∂θ=0

1

⎪∂lnL

=0⎪

⎨∂θ2⎪ ⎪

⎪∂lnL

=0⎪∂θm⎩

(一般称该方程组为对数似然方程组)

求解这个方程组即得到

,θ , θ )就是参数(θ,θ, θ)的估计值。 ③ 上个步骤求出的(θ12m12m

二、区间估计

(X,X, X)是随机变量,无论这个估计量的性由于总体的未知参数θ的估计量θ12n

质有多好,通过一个样本值(x1,x2, xn)所得到的估计值,只能是未知参数θ的近似值,而不是θ的真值。并且样本值不同所得到的估计值也不同。那么θ的真值在什么范围内

呢?能不能通过样本,寻找一个区间,以一定的把握包含总体未知参数θ呢?这就是总体未知参数的区间估计问题。

区间估计严格的定义为: 定义:设总体X的分布函数F(x,θ)含有一个未知参数θ,对于给定值α(0

1(X,X, X)和θ (X,X, X)满足 由样本(X1,X2, Xn)确定的两个的两个统计量θ12n12n 1(X,X, X)

1,θ 2)是参数θ的置信度为1-α的置信区间, 1和θ 2分别趁称为置信度为则称随机区间(θθ

1-α的双侧置信区间的置信下限和置信上限,1-α称为置信度。

单个正态总体的的数学期望和方差的区间估计是我们重点要求掌握的知识点,大家

可以好好阅读教材第189—198面,实际上课本把这种区间估计分各种情形的结论总结成了第209面的表格。大家在理解这些区间估计的实质后,应该把表格的结论和公式记住,往往在实际解题的时候我们只需要套用这些结论就可以了! 三、假设检验

所谓假设检验,顾名思义就是先假设再检验,实际上有点类似于反证法,在实际问题中我们往往需要对未知总体提出某中假设或推断,但是我们的假设可能是错的,也可能是正确的,这时候我们就需要利用一个抽样的样本(x1,x2, xn),通过一定的方法,检验这个假设是否合理,从而作出接受或者拒绝这个假设的结论。

假设检验的基本原理是——小概率事件原理,也即:我们认为小概率事件在一次试验中几乎不可能发生,如果我们在抽取的样本观测值(x1,x2, xn)下,居然使得小概率事件发生了,我们就有理由否定原假设。

在明确一个假设检验问题的性质与基本前提(包括分布类型是否已知,如果类型已

知,分布中包含哪些未知参数等等)之后,假设检验的一般步骤如下:

⑴ 充分考虑和利用已知的背景知识提出原假设H0以及对立假设H1;

⑵ 给定样本,确定合适的检验统计量,并在H0为真下导出统计量的分布(要求此分布不依赖与任何未知参数);

⑶ 确定拒绝域:即依直观分析先确定拒绝域的形式,然后根据给定的显著性水平α和以上统计量的分布由条件概率P{拒绝H0|H0为真}=α确定拒绝域的临界值,从而确定拒绝域;

⑷ 作出判断:由一次具体抽样的样本值计算统计量的值,若统计量的值落入以上拒绝域,则拒绝H0;否则接受H0。

我们重点研究单个正态总体数学期望和方差的假设,两个正态总体均值差和方差比的假设检验,教材分别给出了每种不同类型所用的统计量以及基本步骤(见教材第221—250面)。对不同类型的问题,大家现在应该模仿教材的解法套出一些题目。

在实际解题的时候我们需要注意以下问题: ① 不同类型所用的统计量;

② 用到的统计量中的自由度,以便于查表。


相关内容

  • 洪永淼-经济统计学与计量经济学等相关学科的关系及发展前景
  • 洪永淼:经济统计学与计量经济学等相关学科的关系及发展前景 2016-03-10洪永淼 内容提要 本文从统计学和经济学统一的视角,分析与阐述经济统计学与计量经济学等相关学科--概率论.数理统计学.计量经济学以及经济理论(包括数理经济学)之间的相互关系及发展前景.作为从样本信息推断母体特征的一般方法论, ...

  • 统计学课程感想(混合版)
  • 原专业:12级旅游管理4班 原专业学号:[1**********]2 报读专业:12级会计双专业 双专业学号:47号 统计学原理 统计学是在统计实践的基础上,自17世纪中叶产生并逐步发展起来的一门社会学科.它是研究如何测定.收集.整理.归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科 ...

  • 数理统计学习感想
  • 数理统计学习感想 现实中常常存在这种情况,我们所掌握的数据只是部分单位的数据或有限单位的数据,而我们所关心的却是整个总体甚至是无限总体的数量特征.例如民意测验谁会当选主席?体育锻炼对增强心脏功能是否有益?某种新药是否提高疗效?全国婴儿性别比例如何?等等.这时只靠部分数据的描述是无法获得总体特征的知识 ...

  • 统计方法在医学科研中的正确应用
  • ·54·,1997,30,.1 ·读者·作者·编者· 统计方法在医学科研中的正确应用 汪 涛 金丕焕 医学统计方法广泛应用于医学科学研究.但是由于许多医学科研工作者对统计方法的正确应用缺乏足够的知识,在实际应用时出现了不少问题,影响了结论的可信性.应杂志之邀,我们对医学科研论文中经常出现的统计问题进 ...

  • 统计学发展概况
  • 统计学发展概况 由于人类的统计实践是随着计数活动而产生的,因此,统计发展史可以追溯到远古的原始社会,也就是说距今足有五千多年的漫长岁月.但是,能使人类的统计实践上升到理论上予以概括总结的程度,即开始成为一门系统的学科统计学,却是近代的事情,距今只有三百余年的短暂历史.统计学发展的概貌,大致可划分为古 ...

  • 中小学外语教学研究的统计分析方法使用调研
  • 第28卷第1期北京教育学院学报 Vol.28No.1中小学外语教学研究的统计分析方法使用调研* 李宗强** (阜阳师范学院信息工程学院外语系,安徽阜阳 236041) 摘要:通过调查2001年-2010年国内两种主要的中小学阶段外语教学研究核心期刊发表的 中小学英语教学论文中统计分析方法的使用特点, ...

  • 统计学方法的浅析
  • 统 计 学 方 法 的 浅 析 孟祥旭 文2 12 [1**********] 统计学方法的浅析 统计学是一门值得学习的课程,尤其是对于经济类专业,更是一门必须具备一定统计能力的学科.掌握统计学的知识与方法,是学好统计学的重要途径.统计,顾名思义,统和计,词典上说:统计是指对某一现象有关的数据进行搜 ...

  • 统计抽样方法复习指南
  • 统计抽样方法复习指南 一.掌握统计抽样方法的优越性 (1)通过科学地确定样本规模,避免判断抽样法中样本过多或过少的现象; (2)采用随机原则进行样本选择,减少了人为的偏见; (3)审计人员能够将抽样风险数量化,并加以控制; (4)运用概率统计理论对样本结果进行评价推断总体特征,所得出的审计结论具有 ...

  • 统计学起源详解
  • 第1章 绪 论 §1.1 统计学的产生和发展 一般认为,统计学于十七世纪中叶在英国产生.关于统计学的创始人,一种说法认为是 ①英国人约翰·格朗脱(John Graunt,1620-1674),另一种说法认为是英国人威廉·配第 ②(William Patty,1623-1687).统计史中把他们两人开 ...

  • 单尾假设检验假设设置的探讨_陈秀虎
  • ・8・ 统计教育 2007年第2期 单尾假设检验假设设置的探讨 文/陈秀虎杨敏白厚义 摘要:根据多年的工作经验,本文对在单尾假设检验中,假设设置问题提出了自己的三步解决法:即使用双尾假设的方法进行设置,根据检验问题的重要性选取α值,分步推断统计结果.在实际操作上具有一定的意义,供同仁们参考. 关键词 ...