《多元统计分析》试卷
一、填空题(每空2分,共40分)
1、若X()~Np(,),(1,2,n) 且相互独立,则样本均值向量X服从的分布为
2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 的一种统计方法,常用的判别方法有__
_、、、。
4、Q型聚类是指对_进行聚类,R型聚类是指对进行聚类。
'
5、设样品Xi(Xi1,Xi2,Xip),(i1,2,n),总体X~Np(
,),对样品进行分类
常用的距离有:明氏距离,马氏距离
d(M)(xixj)2ij
1
(xixj),兰氏距离dij(L)
6、因子分析中因子载荷系数aij的统计意义是_第i个变量与第j个公因子的相关系数。 7、一元回归的数学模型是:y01x,多元回归的数学模型
是:
y01x12x2pxp。
8、对应分析是将 和
结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
二、计算题(每小题10分,共40分)
4
1、设三维随机向量X~N3(,),其中1
0
130
0
0,问X1与X2是否独立?2
(X1,X2)和X3是否独立?为什么?
解: 因为cov(X1,X2)1,所以X1与X2不独立。
11
把协差矩阵写成分块矩阵
21
12
,(X1,X2)的协差矩阵为11因为22
cov((X1,X2),X3)12,而120,所以(X1,X2)和X3是不相关的,而正态分布不
相关与相互独立是等价的,所以(X1,X2)和X3是独立的。
2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。若样
本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。
x1x2
x3x4x5
x1013.557
02.546
01.53.5
02
x2
x3
x4
x50
解:样品与样品之间的明氏距离为:D(0)
样品最短距离是1,故把X1与X2合并为一类,计算类与类之间距离(最长距离法)
{x1,x2}x3
x4
x5
{x1,x2}
03.557
01.53.5
02x3
x4
x5 0
得距离阵 D(1)
类与类的最短距离是1.5,故把X3与X4合并为一类,计算类与类之间距离(最长距
离法)得距离阵D(2)
{x1,x2}{x3,x4)
x5
{x1,x2}
057
{x3,x4}
03.5
x5
类与类的最短距离是3.5,故把{X3,X4}与X5合并为一类,计算类与类之间距离(最
{x1,x2}{x,x,x}345
{x1,x2}
07
{x3,x4,x5}
0
长距离法)得距离阵D(3)
分类与聚类图(略)(请你们自己做)
1.00
3、设变量X1,X2,X3的相关阵为R0.63
0.45
0.631.000.35
0.45
0.35,R的特征值和单位化特征向量
1.00
分别为
11.96,l10.63,0.59,0.51;20.68,l20.22,0.49,0.84;
T
T
30.37,l30.75,0.64,0.18
T
(1) 取公共因子个数为2,求因子载荷阵A。
(2) 计算变量共同度hi及公共因子Fj的方差贡献,并说明其统计意义。
0.63.96
解:因子载荷阵A0.59.96
0.51.96
2
2
2
0.220.490.84
0.680.680.68
2
变量共同度:h1(0.63.96)(0.220.68) =
h2(0.59.96)(0.49
2
2
2
2
0.68)=
2
2
h3(0.51.96)(0.840.68)=
公共因子Fj的方差贡献:
S1(0.63.96)(0.59.96)(0.51.96) S2(0.22
0.68)(0.49
2
222
0.68)(0.84
2
0.68)
2
统计意义(省略)(学生自己做)
1
4、设三元总体X的协方差阵为0
0
030
0
0,从出发,求总体主成分F1,F2,F3,并6
求前两个主成分的累积贡献率。
解:
特征方程|E|0,得特征根:16,23,31
5
16的特征方程:0
02
13的特征方程:0
00
11的特征方程:0
0
0300000200x10x2
0x3
0
0u,得特征向量0 1100,得特征向量u21 010,得特征向量u30 0
0x1
0x2
3x3
0x10x2
5x3
F1x3 F2x2 F3x1
前两个主成分的累积贡献率
910
0.9
三、简述题(20分)
简述多元统计的主要内容,结合你本专业谈谈能用到那些统计方法。 (省略)(学生自己做)
《多元统计分析》试卷
一、填空题(每空2分,共40分)
1、若X()~Np(,),(1,2,n) 且相互独立,则样本均值向量X服从的分布为
2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 的一种统计方法,常用的判别方法有__
_、、、。
4、Q型聚类是指对_进行聚类,R型聚类是指对进行聚类。
'
5、设样品Xi(Xi1,Xi2,Xip),(i1,2,n),总体X~Np(
,),对样品进行分类
常用的距离有:明氏距离,马氏距离
d(M)(xixj)2ij
1
(xixj),兰氏距离dij(L)
6、因子分析中因子载荷系数aij的统计意义是_第i个变量与第j个公因子的相关系数。 7、一元回归的数学模型是:y01x,多元回归的数学模型
是:
y01x12x2pxp。
8、对应分析是将 和
结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
二、计算题(每小题10分,共40分)
4
1、设三维随机向量X~N3(,),其中1
0
130
0
0,问X1与X2是否独立?2
(X1,X2)和X3是否独立?为什么?
解: 因为cov(X1,X2)1,所以X1与X2不独立。
11
把协差矩阵写成分块矩阵
21
12
,(X1,X2)的协差矩阵为11因为22
cov((X1,X2),X3)12,而120,所以(X1,X2)和X3是不相关的,而正态分布不
相关与相互独立是等价的,所以(X1,X2)和X3是独立的。
2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。若样
本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。
x1x2
x3x4x5
x1013.557
02.546
01.53.5
02
x2
x3
x4
x50
解:样品与样品之间的明氏距离为:D(0)
样品最短距离是1,故把X1与X2合并为一类,计算类与类之间距离(最长距离法)
{x1,x2}x3
x4
x5
{x1,x2}
03.557
01.53.5
02x3
x4
x5 0
得距离阵 D(1)
类与类的最短距离是1.5,故把X3与X4合并为一类,计算类与类之间距离(最长距
离法)得距离阵D(2)
{x1,x2}{x3,x4)
x5
{x1,x2}
057
{x3,x4}
03.5
x5
类与类的最短距离是3.5,故把{X3,X4}与X5合并为一类,计算类与类之间距离(最
{x1,x2}{x,x,x}345
{x1,x2}
07
{x3,x4,x5}
0
长距离法)得距离阵D(3)
分类与聚类图(略)(请你们自己做)
1.00
3、设变量X1,X2,X3的相关阵为R0.63
0.45
0.631.000.35
0.45
0.35,R的特征值和单位化特征向量
1.00
分别为
11.96,l10.63,0.59,0.51;20.68,l20.22,0.49,0.84;
T
T
30.37,l30.75,0.64,0.18
T
(1) 取公共因子个数为2,求因子载荷阵A。
(2) 计算变量共同度hi及公共因子Fj的方差贡献,并说明其统计意义。
0.63.96
解:因子载荷阵A0.59.96
0.51.96
2
2
2
0.220.490.84
0.680.680.68
2
变量共同度:h1(0.63.96)(0.220.68) =
h2(0.59.96)(0.49
2
2
2
2
0.68)=
2
2
h3(0.51.96)(0.840.68)=
公共因子Fj的方差贡献:
S1(0.63.96)(0.59.96)(0.51.96) S2(0.22
0.68)(0.49
2
222
0.68)(0.84
2
0.68)
2
统计意义(省略)(学生自己做)
1
4、设三元总体X的协方差阵为0
0
030
0
0,从出发,求总体主成分F1,F2,F3,并6
求前两个主成分的累积贡献率。
解:
特征方程|E|0,得特征根:16,23,31
5
16的特征方程:0
02
13的特征方程:0
00
11的特征方程:0
0
0300000200x10x2
0x3
0
0u,得特征向量0 1100,得特征向量u21 010,得特征向量u30 0
0x1
0x2
3x3
0x10x2
5x3
F1x3 F2x2 F3x1
前两个主成分的累积贡献率
910
0.9
三、简述题(20分)
简述多元统计的主要内容,结合你本专业谈谈能用到那些统计方法。 (省略)(学生自己做)