《统计学》(贾俊平)
1 参数估计
1.参数估计:统计推断的重要内容之一,以抽样和抽样分布为基础,用样本
统计量来估计未知总体参数。
2.估计量:估计总体参数的统计量。
3.估计值:用具体样本计算出的估计量的值,即估计量的实现。
4.点估计:用某个估计值作为总体参数的估计。
5.区间估计:以点估计为基础,给出总体参数估计的一个区间范围,由点估计量加减边际误差得到。能由抽样分布给出估计量与总体参数接近程度的概率度量,即置信水平。
6.置信区间:总体参数的估计区间。统计学家在某种程度上确信它会包含总体参数真值,是随机区间。
7.置信水平(置信度):重复构造置信区间多次,其中包含总体参数真值的区间个数所占的比例。它是针对随机区间而言的。
8.估计量评价标准:无偏性、有效性、一致性。
9.理论基础
①大数定律:揭示了大量随机现象均值的稳定性。常见的有伯努利大数定律(频率稳定性),辛钦大数定律(简单随机样本均值依概率收敛于总体均值),切比雪夫大数定律。是用样本估计总体的理论基础。
②中心极限定理:揭示了独立同分布随机变量之和的极限分布是正态分布。
常见的有伯努利试验场合、独立同分布试验场合的中心极限定理。是区间估计和假设检验的理论基础。
③抽样分布基本定理(正态假定)
a. X~N(μ,σ2/n); b. (n-1)S2/σ2~χ2(n-1); c. X与S2相互独立; d.
S1/S2
22
22
X-~t(n-1)
;
e.
σ1/σ2
~F(n1-1,n2-1) (独立样本);
f.
~t(n1+n2-2) (独立样本,σ1=σ2)。
22
10.单总体参数估计
①目标量:μ,π,σ2。
②影响因素:a.是否是正态总体;b.总体方差是否已知;c.是大样本还
是小样本。
③抽样分布
a.
Z=
~N(0,1); b.
t=
⎧~t(n-1) ,
~⎨
~N(0,1) (大样本) ;⎩
c.
Z=
p-~ N(0,1) (大样本,np≥5,n(n-p)≥5);
d. χ2=(n-1)S2/σ2~χ2(n-1)。
11.两总体参数估计
①目标量:μ1-μ2,π1-π2,σ12-σ22。
②影响因素:a.是否是正态总体;b.两总体总体方差是否已知、是否相
等;c.是大样本还是小样本,两样本量是否相等;d.是独立样本还是匹配样本。
③抽样分布
a.
Z=
~N(0,1) (独立样本);
~ N(0,1) (独立大样本);
b.
Z=
~t(n1+n2-2) (独立样本,σ1=σ2);
2
2
c.
t=
d.
Z=
~N(0,1) (匹配样本);
e.
Z=
~ N(0,1) (匹配大样本);
f.
Z=
~ N(0,1) (独立大样本);
g. F=
S1/S2
2222
σ/σ
21
~F(n-1,n-2) (独立样本)。
12.
确定样本量:E=zα/2
⇒n=
zα/2σE
2
22
(1-α表示可靠性,E表示精度)。
2 假设检验
1.假设检验:统计推断的重要内容之一,先对总体参数提出一个假设,然后
利用样本来检验该假设是否成立。
2.原假设与备择假设:假设检验是围绕原假设是否成立展开的,若拒绝原假设,就用备择假设来替换。推翻原假设需要样本落入否定域,这是小概率事件,故在一次试验中原假设具有优势而备择假设不易发生,一旦发生,我们就有足够的理由推翻原假设,这意味着新结论的诞生。
3.弃真错误(α错误)与取伪错误(β错误):前者是原假设为真却被拒绝所犯的错误,后者是原假设为假却没被拒绝所犯的错误。样本量一定时,两者是此消彼长的关系;若增大样本量,则两者同时变小。假设检验中遵循“首先控制犯α错误”的原则。
4.小概率原理:发生概率很小的随机事件在一次试验中几乎不可能发生。
5.统计量检验与P值检验
①否定域:由一个直观上有明确意义的统计量确定。
②P值:当原假设为真时,得到所观测结果或更极端结果的概率。
③比较:统计量检验是先确定一个显著性水平α从而获得一个否定域,进
行决策的界限清晰但面临的风险是笼统的,确定临界值要查表,检验统计量一般与自由度有关因而可比性较差;P值是检验的真实显著性水平,可利用P值直接决策或将P值与α进行比较,不需要查表,具有可比性。
6.假设检验流程图(见图1)
3 方差分析
1.基本思想:表面上是检验多总体均值是否相等,本质上是研究变量间的关系,即通过各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响,其中需要分析数据变异的来源。观察到的数据一般是参差不齐的,我们用SST度量数据总的变异,将它分解为可追溯到来源的部分变异SSE与SSA之和,
若后者的平均MSA明显比前者的平均MSE大,
图1
就认为自变量对因变量有显著影响。在方差分析的基本假定下,上述问题形式上就转化为检验各总体均值是否相等的问题。
2.基本假定:a.各总体服从正态分布;b.各总体方差相同;c.各观测值相互独立。
3.方差分析与两两均值检验:两两均值检验会增加犯第Ⅰ累错误的概率(1-(1-α)n(n-1)/2>α),而且随着检验次数的增多,偶然因素导致差别的可能性也会增加;方差分析是同时考虑所有样本,排除了错误的累积,减少了偶然因素的不利影响,也简化了检验的过程。
4.单因素方差分析 ①数据结构
C1 C2 Ck
x11 x12 x1k x21 x22 x2k
xn1 xn1 xnk
1
2
k
表1
②方差分析模型
由基本假定,xij~N(μj,σ2), i=1, ,nj;j=1, ,k 令εij=xij-μj~N(0,σ2) 有xij=μj+εij 令总均值μ=
k
1n
kk
j
∑n
j=1
k
μj (n=
∑n
j=1
j
)
有∑nj(μj-μ)=
j=1
∑nα
j
j=1
j
=0 (αj称为第j个水平的效应)
得单因素方差分析模型
⎧x=μ+α+ε, i=1, ,n;j=1, ,k
jijj
⎪ij⎪2
⎨εij~N(0,σ), 各εij相互独立
⎪k
nα=0⎪⎩∑j=1jj
③步骤
a.
H0:μ=
k
1
提
=μ
出
⇔kα10
H0
假
H
设
不=全相等α:;jj
=
:
(
kμ=
1
b.构造检验统计量:F=c.统计决策。
④方差分析表
MSAMSE
~ F(k-1,n-k);
5.有交互作用的双因素方差分析(等重复试验情况): ①数据结构(见表3) ②方差分析模型
由基本假定,xijl~N(μij,σ2), i=1, ,s;j=1, ,k;l=1, ,m
令εijl=xijl-μij~N(0,σ2)
有xijl=μij+εijl
令μ=令
αi=
⋅
μ∑∑sk
i=1
j=1
1
sk
ij
, μi⋅=
μ∑k
j=1
1
k
ij
, μ⋅j=
1
s
ij
μ∑s
i=1
互
效
i
j
行
⋅j
、列、
(μ ⋅i=
交
j
应
μ
i
μ,i-
μ=β
,j-μ
α
⋅
-β-+μ
j
μ
得有交互作用因素方差分析模型
⎧x=μ+α+β+(αβ)+ε, i=1, ,s;j=1, ,k;l=1, ,m
ijijijl
⎪ijl⎪2
⎨εijl~N(0,σ), 各εijl相互独立
⎪sksk
α=β=(αβ)=⎪∑j=1(αβ)ij=0ij
⎩∑i=1j∑j=1j∑i=1
③原假设与检验统计量
⎧H01:μ1⋅= =μs⋅⇔α1= =αs=0⎪
⎨H02:μ⋅1= =μ⋅k⇔β1= =βs=0⎪
⎩H03:两因素个水平间无交互作用⇔(αβ)11= =(αβ)sk=0
FR=
SSR/(s-1)SSE/[sk(m-1)]
, FC=
SSC/(k-1)SSE/[sk(m-1)]
, FRC=
SSRC/[(s-1)(k-1)]SSE/[sk(m-1)]
6.无交互作用的双因素方差分析 ①数据结构(见表4) ②方差分析模型
由基本假定,xij~N(μij,σ2), i=1, ,s;j=1, ,k
令εij=xij-μij~N(0,σ2)
有xij=μij+εij 令μ=令
αi=
⋅
1sk
sk
ij
∑∑μ
i=1
j=1
, μi⋅=
1k
k
∑μ
j=1
ij
, μ⋅j=
1s
s
∑μ
i=1
ij
互
效
i
j
行
⋅j
、列、
(μ
⋅i
交
=
j
应
μ
i
μ,i-
μ=β
,j-μ
α
⋅
-β-+μ
=j
μ
得无交互作用因素方差分析模型
⎧x=μ+α+β+ε, i=1, ,s;j=1, ,k
ijij
⎪ij⎪2
⎨εij~N(0,σ), 各εij相互独立
⎪sk
α=β=0⎪⎩∑i=1j∑j=1j
③原假设与检验统计量
⎧H01:μ1⋅= =μs⋅⇔α1= =αs=0
⎨
⎩H02:μ⋅1= =μ⋅k⇔β1= =βs=0FR=
SSR/(s-1)SSE/[(s-1)(k-1)]
, FC=
SSC/(k-1)SSE/[(s-1)(k-1)]
7.多重比较:当方差分析拒绝原假设时,为进一步分析到底是哪些均值不相等,于是将各均值配对检验,但检验统计量不是t统计量。
8.试验设计
①含义:收集样本的计划,通过科学安排试验,用尽可能少的试验获得尽可能多的信息。主要数据分析方法是方差分析。
②完全随机化设计:将各种处理随机指派给试验单元。数据分析方法是单
因素方差分析。
③随机化区组设计:将试样单元划分为若干区组,再将各种处理随机指派
给各区组。划分区组可消除试验单元的差异造成的影响。因每个区组只做一次试
验,故只能采用无交互作用双因素方差分析方法。
④因子设计:考虑两个或多个因素搭配的试验设计,每种搭配可重复试验。
数据分析方法是有交互作用双因素方差分析。
4 数据整理与展示
1.数据类型与图示法
图2
2.几种图示法的比较
①条形图与直方图:前者用长度表视频数(率),宽度固定,各矩形分开排列,主要展示分类数据;后者用面积表示频数(率),宽度为组距,各矩形连续排列,主要展示数值型数据。
②茎叶图与直方图:前者类似于横直直方图,既能展示数据分布状况,又
保留了原始数据,适用于小批量数据;后者也能很好显示数据分布状况,但不能保留原始数据,适用于大批量数据。
③饼图与环形图:前者只能显示一个样本或总体的比例数据;后者可以同
时显示多个样本或总体的比例数据,有利于比较。
5 数据分布特征
1. 描述统计量(见图3)
2.众数、中位数、平均数的比较
①众数:一组数据分布的峰值,不受极端值影响,不具有唯一性,没有利用全部数据,适用于较大量的分类数据。
②中位数:一组数据中间位置的代表值,不受极端值影响,
只利用了一个
数据,信息
图3
浪费严重,适用于偏斜度较大的顺序数据。
③平均数:一组数据的重心,应用最广泛的集中趋势测度值,具有优良的
数学性质,是统计推断的基础,利用了全部数据,易受极端值影响,适用于偏斜度不大的数值型数据。
《统计学》(贾俊平)
1 参数估计
1.参数估计:统计推断的重要内容之一,以抽样和抽样分布为基础,用样本
统计量来估计未知总体参数。
2.估计量:估计总体参数的统计量。
3.估计值:用具体样本计算出的估计量的值,即估计量的实现。
4.点估计:用某个估计值作为总体参数的估计。
5.区间估计:以点估计为基础,给出总体参数估计的一个区间范围,由点估计量加减边际误差得到。能由抽样分布给出估计量与总体参数接近程度的概率度量,即置信水平。
6.置信区间:总体参数的估计区间。统计学家在某种程度上确信它会包含总体参数真值,是随机区间。
7.置信水平(置信度):重复构造置信区间多次,其中包含总体参数真值的区间个数所占的比例。它是针对随机区间而言的。
8.估计量评价标准:无偏性、有效性、一致性。
9.理论基础
①大数定律:揭示了大量随机现象均值的稳定性。常见的有伯努利大数定律(频率稳定性),辛钦大数定律(简单随机样本均值依概率收敛于总体均值),切比雪夫大数定律。是用样本估计总体的理论基础。
②中心极限定理:揭示了独立同分布随机变量之和的极限分布是正态分布。
常见的有伯努利试验场合、独立同分布试验场合的中心极限定理。是区间估计和假设检验的理论基础。
③抽样分布基本定理(正态假定)
a. X~N(μ,σ2/n); b. (n-1)S2/σ2~χ2(n-1); c. X与S2相互独立; d.
S1/S2
22
22
X-~t(n-1)
;
e.
σ1/σ2
~F(n1-1,n2-1) (独立样本);
f.
~t(n1+n2-2) (独立样本,σ1=σ2)。
22
10.单总体参数估计
①目标量:μ,π,σ2。
②影响因素:a.是否是正态总体;b.总体方差是否已知;c.是大样本还
是小样本。
③抽样分布
a.
Z=
~N(0,1); b.
t=
⎧~t(n-1) ,
~⎨
~N(0,1) (大样本) ;⎩
c.
Z=
p-~ N(0,1) (大样本,np≥5,n(n-p)≥5);
d. χ2=(n-1)S2/σ2~χ2(n-1)。
11.两总体参数估计
①目标量:μ1-μ2,π1-π2,σ12-σ22。
②影响因素:a.是否是正态总体;b.两总体总体方差是否已知、是否相
等;c.是大样本还是小样本,两样本量是否相等;d.是独立样本还是匹配样本。
③抽样分布
a.
Z=
~N(0,1) (独立样本);
~ N(0,1) (独立大样本);
b.
Z=
~t(n1+n2-2) (独立样本,σ1=σ2);
2
2
c.
t=
d.
Z=
~N(0,1) (匹配样本);
e.
Z=
~ N(0,1) (匹配大样本);
f.
Z=
~ N(0,1) (独立大样本);
g. F=
S1/S2
2222
σ/σ
21
~F(n-1,n-2) (独立样本)。
12.
确定样本量:E=zα/2
⇒n=
zα/2σE
2
22
(1-α表示可靠性,E表示精度)。
2 假设检验
1.假设检验:统计推断的重要内容之一,先对总体参数提出一个假设,然后
利用样本来检验该假设是否成立。
2.原假设与备择假设:假设检验是围绕原假设是否成立展开的,若拒绝原假设,就用备择假设来替换。推翻原假设需要样本落入否定域,这是小概率事件,故在一次试验中原假设具有优势而备择假设不易发生,一旦发生,我们就有足够的理由推翻原假设,这意味着新结论的诞生。
3.弃真错误(α错误)与取伪错误(β错误):前者是原假设为真却被拒绝所犯的错误,后者是原假设为假却没被拒绝所犯的错误。样本量一定时,两者是此消彼长的关系;若增大样本量,则两者同时变小。假设检验中遵循“首先控制犯α错误”的原则。
4.小概率原理:发生概率很小的随机事件在一次试验中几乎不可能发生。
5.统计量检验与P值检验
①否定域:由一个直观上有明确意义的统计量确定。
②P值:当原假设为真时,得到所观测结果或更极端结果的概率。
③比较:统计量检验是先确定一个显著性水平α从而获得一个否定域,进
行决策的界限清晰但面临的风险是笼统的,确定临界值要查表,检验统计量一般与自由度有关因而可比性较差;P值是检验的真实显著性水平,可利用P值直接决策或将P值与α进行比较,不需要查表,具有可比性。
6.假设检验流程图(见图1)
3 方差分析
1.基本思想:表面上是检验多总体均值是否相等,本质上是研究变量间的关系,即通过各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响,其中需要分析数据变异的来源。观察到的数据一般是参差不齐的,我们用SST度量数据总的变异,将它分解为可追溯到来源的部分变异SSE与SSA之和,
若后者的平均MSA明显比前者的平均MSE大,
图1
就认为自变量对因变量有显著影响。在方差分析的基本假定下,上述问题形式上就转化为检验各总体均值是否相等的问题。
2.基本假定:a.各总体服从正态分布;b.各总体方差相同;c.各观测值相互独立。
3.方差分析与两两均值检验:两两均值检验会增加犯第Ⅰ累错误的概率(1-(1-α)n(n-1)/2>α),而且随着检验次数的增多,偶然因素导致差别的可能性也会增加;方差分析是同时考虑所有样本,排除了错误的累积,减少了偶然因素的不利影响,也简化了检验的过程。
4.单因素方差分析 ①数据结构
C1 C2 Ck
x11 x12 x1k x21 x22 x2k
xn1 xn1 xnk
1
2
k
表1
②方差分析模型
由基本假定,xij~N(μj,σ2), i=1, ,nj;j=1, ,k 令εij=xij-μj~N(0,σ2) 有xij=μj+εij 令总均值μ=
k
1n
kk
j
∑n
j=1
k
μj (n=
∑n
j=1
j
)
有∑nj(μj-μ)=
j=1
∑nα
j
j=1
j
=0 (αj称为第j个水平的效应)
得单因素方差分析模型
⎧x=μ+α+ε, i=1, ,n;j=1, ,k
jijj
⎪ij⎪2
⎨εij~N(0,σ), 各εij相互独立
⎪k
nα=0⎪⎩∑j=1jj
③步骤
a.
H0:μ=
k
1
提
=μ
出
⇔kα10
H0
假
H
设
不=全相等α:;jj
=
:
(
kμ=
1
b.构造检验统计量:F=c.统计决策。
④方差分析表
MSAMSE
~ F(k-1,n-k);
5.有交互作用的双因素方差分析(等重复试验情况): ①数据结构(见表3) ②方差分析模型
由基本假定,xijl~N(μij,σ2), i=1, ,s;j=1, ,k;l=1, ,m
令εijl=xijl-μij~N(0,σ2)
有xijl=μij+εijl
令μ=令
αi=
⋅
μ∑∑sk
i=1
j=1
1
sk
ij
, μi⋅=
μ∑k
j=1
1
k
ij
, μ⋅j=
1
s
ij
μ∑s
i=1
互
效
i
j
行
⋅j
、列、
(μ ⋅i=
交
j
应
μ
i
μ,i-
μ=β
,j-μ
α
⋅
-β-+μ
j
μ
得有交互作用因素方差分析模型
⎧x=μ+α+β+(αβ)+ε, i=1, ,s;j=1, ,k;l=1, ,m
ijijijl
⎪ijl⎪2
⎨εijl~N(0,σ), 各εijl相互独立
⎪sksk
α=β=(αβ)=⎪∑j=1(αβ)ij=0ij
⎩∑i=1j∑j=1j∑i=1
③原假设与检验统计量
⎧H01:μ1⋅= =μs⋅⇔α1= =αs=0⎪
⎨H02:μ⋅1= =μ⋅k⇔β1= =βs=0⎪
⎩H03:两因素个水平间无交互作用⇔(αβ)11= =(αβ)sk=0
FR=
SSR/(s-1)SSE/[sk(m-1)]
, FC=
SSC/(k-1)SSE/[sk(m-1)]
, FRC=
SSRC/[(s-1)(k-1)]SSE/[sk(m-1)]
6.无交互作用的双因素方差分析 ①数据结构(见表4) ②方差分析模型
由基本假定,xij~N(μij,σ2), i=1, ,s;j=1, ,k
令εij=xij-μij~N(0,σ2)
有xij=μij+εij 令μ=令
αi=
⋅
1sk
sk
ij
∑∑μ
i=1
j=1
, μi⋅=
1k
k
∑μ
j=1
ij
, μ⋅j=
1s
s
∑μ
i=1
ij
互
效
i
j
行
⋅j
、列、
(μ
⋅i
交
=
j
应
μ
i
μ,i-
μ=β
,j-μ
α
⋅
-β-+μ
=j
μ
得无交互作用因素方差分析模型
⎧x=μ+α+β+ε, i=1, ,s;j=1, ,k
ijij
⎪ij⎪2
⎨εij~N(0,σ), 各εij相互独立
⎪sk
α=β=0⎪⎩∑i=1j∑j=1j
③原假设与检验统计量
⎧H01:μ1⋅= =μs⋅⇔α1= =αs=0
⎨
⎩H02:μ⋅1= =μ⋅k⇔β1= =βs=0FR=
SSR/(s-1)SSE/[(s-1)(k-1)]
, FC=
SSC/(k-1)SSE/[(s-1)(k-1)]
7.多重比较:当方差分析拒绝原假设时,为进一步分析到底是哪些均值不相等,于是将各均值配对检验,但检验统计量不是t统计量。
8.试验设计
①含义:收集样本的计划,通过科学安排试验,用尽可能少的试验获得尽可能多的信息。主要数据分析方法是方差分析。
②完全随机化设计:将各种处理随机指派给试验单元。数据分析方法是单
因素方差分析。
③随机化区组设计:将试样单元划分为若干区组,再将各种处理随机指派
给各区组。划分区组可消除试验单元的差异造成的影响。因每个区组只做一次试
验,故只能采用无交互作用双因素方差分析方法。
④因子设计:考虑两个或多个因素搭配的试验设计,每种搭配可重复试验。
数据分析方法是有交互作用双因素方差分析。
4 数据整理与展示
1.数据类型与图示法
图2
2.几种图示法的比较
①条形图与直方图:前者用长度表视频数(率),宽度固定,各矩形分开排列,主要展示分类数据;后者用面积表示频数(率),宽度为组距,各矩形连续排列,主要展示数值型数据。
②茎叶图与直方图:前者类似于横直直方图,既能展示数据分布状况,又
保留了原始数据,适用于小批量数据;后者也能很好显示数据分布状况,但不能保留原始数据,适用于大批量数据。
③饼图与环形图:前者只能显示一个样本或总体的比例数据;后者可以同
时显示多个样本或总体的比例数据,有利于比较。
5 数据分布特征
1. 描述统计量(见图3)
2.众数、中位数、平均数的比较
①众数:一组数据分布的峰值,不受极端值影响,不具有唯一性,没有利用全部数据,适用于较大量的分类数据。
②中位数:一组数据中间位置的代表值,不受极端值影响,
只利用了一个
数据,信息
图3
浪费严重,适用于偏斜度较大的顺序数据。
③平均数:一组数据的重心,应用最广泛的集中趋势测度值,具有优良的
数学性质,是统计推断的基础,利用了全部数据,易受极端值影响,适用于偏斜度不大的数值型数据。