聚类分析练习题20121105

聚类分析和判别分析练习题

一、选择题

1. 需要在聚类分析中保序的聚类分析是( )。

A. 两步聚类 B. 有序聚类 C. 系统聚类 D.k-均值聚类 2. 在系统聚类中R 2是( )。

A. 组内离差平方和除以组间离差平方和 B. 组间离差平方和除以组内离差平方和 C. 组间离差平方和除以总离差平方和 D. 组间均方除以总均方。 3. 系统聚类的单调性是指( )。 A. 每步并类的距离是单调增的 B. 每步并类的距离是单调减的 C. 聚类的类数越来越少 D. 系统聚类R 2会越来越小

4. 以下的系统聚类方法中,哪种系统聚类直接利用了组内的离差平方和。( ) A. 最长距离法 B. 组间平均连接法 C. 组内平均连接法 D.WARD 法

5. 以下系统聚类方法中所用的相似性的度量,哪种最不稳健( )。 p

A. ∑(x ik -x 2

x jk

2jk ) B.

C.

D. (x i -x -1j ) 'Σ(x i -x j ) k =1∑p

x ik -k =1x

ik

+x jk

∑p

k =1 6. 以下系统聚类方法中所用的相似性的度量,哪种考虑了变量间的相关性( p

p

2

p

A. ∑(x ik -x jk ) B.

x ik -x jk

C.

-x j ) 'Σ-1(x i -x j ) k =1∑k =1

x

ik

+x jk

∑2 D. (x i k =1

7. 以下统计量,可以用来刻画分为几类的合理性统计量为( )? A. 可决系数或判定系数R 2 B.

W -P G

P G

W -P G )/(G -1) (C.

P G /(n -G )

D.

(W -P G )

W

8. 以下关于聚类分析的陈述,哪些是正确的( ) A. 进行聚类分析的统计数据有关于类的变量 B. 进行聚类分析的变量应该进行标准化处理 C. 不同的类间距离会产生不同的递推公式

D. 递推公式有利于运算速度的提高。D(3)的信息需要D (2)提供。 9. 判别分析和聚类分析所要求统计数据的不同是( ) A. 判别分析没有刻画类的变量,聚类分析有该变量 B. 聚类分析没有刻画类的变量,判别分析有该变量 C. 分析的变量在不同的样品上要有差异 D. 要选择与研究目的有关的变量 10. 距离判别法所用的距离是( )

A. 马氏距离 B. 欧氏距离 C. 绝对值距离 D. 欧氏平方距离

11. 在一些条件同时满足的场合,距离判别和贝叶斯判别等价,是以下哪些条件。 ( )

A. 正态分布假定 B. 等协方差矩阵假定 C. 均值相等假定 D. 先验概率相等假定

12. 常用逐步判别分析选择不了的标准是( ) A. Λ统计量越小变量的判别贡献更大 B. Λ统计量越大变量的判别贡献更大 C. 判定系数越小变量的判别贡献更大 D. 判定系数越大变量的判别贡献更大 二、填空题

1、聚类分析是建立一种分类方法,它将一批样本或变量按照它们在性质上的_______________进行科学的分类。

2.Q 型聚类法是按_________进行聚类,R 型聚类法是按_______进行聚类。

3.Q 型聚类相似程度指标常见是 ,而R 型聚类相似程度指标通常采用_____________ 、 。

4.在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量纲或数量级的影响,达到数据间

可同度量的目的。常用的无量纲化方法有以下几种:_____________、____________、_____ ___。

5.六种Q 型聚类方法分别为、、、 _____________、___________、_____________。

6.判别分析是要解决在研究对象已知_________________的情况下,确定新的观测数据属于已知类别中哪一类的多元统计方法。

7.用判别分析方法处理问题时,通常以__________作为衡量新样本点与各已知组别接近程度的指标。 8.进行判别分析时,通常指定一种判别规则,用来判定新样本的归属,常见的判别准则有____________、_____________。

9.类内样本点接近,类间样本点疏远的性质,可以通过_____________与___________的大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差异越_____,分类效果越______。

10. 最大的错判概率为 11. 两个点x 和y 是从同一个总体中抽出的样本,二者的马氏距离可以表达为

三、总结系统聚类有哪些方法?他们的D (0)可以如何定义,其各种方法的递推公式式什么。证明类平均法的递推公式是

n K D 2(J , K ) +n L D 2(J , L ) D (J , M ) =

n K +n L

2

四、系统聚类类别的确定有哪些方法或指标? 五、如果在系统聚类时,某步产生了如下的两个小类

, (28, ) 4, )4, (6, ⎤ ⎡ , 5⎡⎣(2, 3, )4, (3, 4, 5) , ⎤⎦( 3⎣⎦4 , 5)

如果用离差平方和法聚类,两个小类的距离是多少。

六、简述系统聚类法的基本思想及主要步骤。 六、简述快速聚类的基本思想及主要步骤。

七、某地区将农村经济类型分为三类:G1—较富裕类型,G2—中等类型,G3—较贫困类型。每种类型以五个指标为依据:x1=土地生产率=农村社会总产值/总土地面积(百元/每亩) ,x2=劳动生产率=农村社会总产值/农村劳动力(百元/每个劳动力) ,x3=人均收入=农村经济纯收入/农业人口(百元/每人) ,x4=费用水平=总费用/总收入, x5=农村工业比重=农村工业产值/农村社会总产值。每种类型分别有容量为n 1=5,n2=8,n3=4的样本(每个个体以县为单位) ,其数据如下:

(2) 试以x1,x2,x3,x4,x5为变量,建立马氏距离判别函数

八、设两个二维总体有公共协方差,从二总体中分别抽取了容量为9和8的样本,其数据如下: 九、以下数据是20种啤酒的相关数据,进行聚类分析。

十、讨论系统聚类、k 均值聚类和有序聚类的技术。说明其特点。

聚类分析和判别分析练习题

一、选择题

1. 需要在聚类分析中保序的聚类分析是( )。

A. 两步聚类 B. 有序聚类 C. 系统聚类 D.k-均值聚类 2. 在系统聚类中R 2是( )。

A. 组内离差平方和除以组间离差平方和 B. 组间离差平方和除以组内离差平方和 C. 组间离差平方和除以总离差平方和 D. 组间均方除以总均方。 3. 系统聚类的单调性是指( )。 A. 每步并类的距离是单调增的 B. 每步并类的距离是单调减的 C. 聚类的类数越来越少 D. 系统聚类R 2会越来越小

4. 以下的系统聚类方法中,哪种系统聚类直接利用了组内的离差平方和。( ) A. 最长距离法 B. 组间平均连接法 C. 组内平均连接法 D.WARD 法

5. 以下系统聚类方法中所用的相似性的度量,哪种最不稳健( )。 p

A. ∑(x ik -x 2

x jk

2jk ) B.

C.

D. (x i -x -1j ) 'Σ(x i -x j ) k =1∑p

x ik -k =1x

ik

+x jk

∑p

k =1 6. 以下系统聚类方法中所用的相似性的度量,哪种考虑了变量间的相关性( p

p

2

p

A. ∑(x ik -x jk ) B.

x ik -x jk

C.

-x j ) 'Σ-1(x i -x j ) k =1∑k =1

x

ik

+x jk

∑2 D. (x i k =1

7. 以下统计量,可以用来刻画分为几类的合理性统计量为( )? A. 可决系数或判定系数R 2 B.

W -P G

P G

W -P G )/(G -1) (C.

P G /(n -G )

D.

(W -P G )

W

8. 以下关于聚类分析的陈述,哪些是正确的( ) A. 进行聚类分析的统计数据有关于类的变量 B. 进行聚类分析的变量应该进行标准化处理 C. 不同的类间距离会产生不同的递推公式

D. 递推公式有利于运算速度的提高。D(3)的信息需要D (2)提供。 9. 判别分析和聚类分析所要求统计数据的不同是( ) A. 判别分析没有刻画类的变量,聚类分析有该变量 B. 聚类分析没有刻画类的变量,判别分析有该变量 C. 分析的变量在不同的样品上要有差异 D. 要选择与研究目的有关的变量 10. 距离判别法所用的距离是( )

A. 马氏距离 B. 欧氏距离 C. 绝对值距离 D. 欧氏平方距离

11. 在一些条件同时满足的场合,距离判别和贝叶斯判别等价,是以下哪些条件。 ( )

A. 正态分布假定 B. 等协方差矩阵假定 C. 均值相等假定 D. 先验概率相等假定

12. 常用逐步判别分析选择不了的标准是( ) A. Λ统计量越小变量的判别贡献更大 B. Λ统计量越大变量的判别贡献更大 C. 判定系数越小变量的判别贡献更大 D. 判定系数越大变量的判别贡献更大 二、填空题

1、聚类分析是建立一种分类方法,它将一批样本或变量按照它们在性质上的_______________进行科学的分类。

2.Q 型聚类法是按_________进行聚类,R 型聚类法是按_______进行聚类。

3.Q 型聚类相似程度指标常见是 ,而R 型聚类相似程度指标通常采用_____________ 、 。

4.在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量纲或数量级的影响,达到数据间

可同度量的目的。常用的无量纲化方法有以下几种:_____________、____________、_____ ___。

5.六种Q 型聚类方法分别为、、、 _____________、___________、_____________。

6.判别分析是要解决在研究对象已知_________________的情况下,确定新的观测数据属于已知类别中哪一类的多元统计方法。

7.用判别分析方法处理问题时,通常以__________作为衡量新样本点与各已知组别接近程度的指标。 8.进行判别分析时,通常指定一种判别规则,用来判定新样本的归属,常见的判别准则有____________、_____________。

9.类内样本点接近,类间样本点疏远的性质,可以通过_____________与___________的大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差异越_____,分类效果越______。

10. 最大的错判概率为 11. 两个点x 和y 是从同一个总体中抽出的样本,二者的马氏距离可以表达为

三、总结系统聚类有哪些方法?他们的D (0)可以如何定义,其各种方法的递推公式式什么。证明类平均法的递推公式是

n K D 2(J , K ) +n L D 2(J , L ) D (J , M ) =

n K +n L

2

四、系统聚类类别的确定有哪些方法或指标? 五、如果在系统聚类时,某步产生了如下的两个小类

, (28, ) 4, )4, (6, ⎤ ⎡ , 5⎡⎣(2, 3, )4, (3, 4, 5) , ⎤⎦( 3⎣⎦4 , 5)

如果用离差平方和法聚类,两个小类的距离是多少。

六、简述系统聚类法的基本思想及主要步骤。 六、简述快速聚类的基本思想及主要步骤。

七、某地区将农村经济类型分为三类:G1—较富裕类型,G2—中等类型,G3—较贫困类型。每种类型以五个指标为依据:x1=土地生产率=农村社会总产值/总土地面积(百元/每亩) ,x2=劳动生产率=农村社会总产值/农村劳动力(百元/每个劳动力) ,x3=人均收入=农村经济纯收入/农业人口(百元/每人) ,x4=费用水平=总费用/总收入, x5=农村工业比重=农村工业产值/农村社会总产值。每种类型分别有容量为n 1=5,n2=8,n3=4的样本(每个个体以县为单位) ,其数据如下:

(2) 试以x1,x2,x3,x4,x5为变量,建立马氏距离判别函数

八、设两个二维总体有公共协方差,从二总体中分别抽取了容量为9和8的样本,其数据如下: 九、以下数据是20种啤酒的相关数据,进行聚类分析。

十、讨论系统聚类、k 均值聚类和有序聚类的技术。说明其特点。


相关内容

  • 20121030东南食来运转视频:波士顿龙虾的做法
  • 下面是该视频的在线观看和主要内容介绍: 波士顿龙虾生活于寒冷海域,肉较嫩滑细致,产品具有高蛋白,低脂肪,维生素A.C.D及钙.钠.钾.镁.磷.铁.硫.铜等微量元素丰富,味道鲜美. 波士顿龙虾的营养价值 因生活于寒冷海域,所以生长特别缓慢.产品具有高蛋白,低脂肪,维生素A.C.D及钙.钠.钾.镁.磷. ...

  • 机械制图第三版王幼龙第五章教案(18-26)
  • 机械制图电子教案(18) [课题编号] 18-5① [课题名称] 组合体的概念和分析方法.组合形式 [教材版本] 王幼龙主编.中等职业教育国家规划教材--机械制图(机械类),第3版,北京:高等教育出版社,2007. 王幼龙主编.中等职业教育国家规划教材配套教学用书--机械制图习题集(机械类),第3版 ...

  • 2011高三物理总复习安排
  • 高三物理总复习的指导思想就是通过物理总复习,把握物理概念及其相互关系,熟练把握物理规律、公式及应用,总结解题方法与技巧,从而提高分析问题和解决问题的能力。 一、根据物理学科的特点,把物理总复习分为三个阶段: 第一阶段: 以章、节为单元进行单元复习练习,时间上约从高三上学期到高三下学期期中考试前,即头 ...

  • 浅谈行业分析和公司分析在投资中的作用
  • 行业分析 投资价值分析的前提和基础 行业研究在公司价值分析的作用主是为公司价值分析长眼:以行业的眼光去判断公司,去发现投资价值和投资机会.企业和所在行业之间的关系是点和点所在面的关系,企业的价值取决于企业的现在和未来收益,而行业的现状和发展趋势在很大程度上决定了行业内企 业现在和未来收益,行业经营的 ...

  • 分析化学教材(系列一)
  • 分析化学教材(系列一) 目 录 第一章 绪论 第二章 误差和分析数据处理 第三章 滴定分析法概论 第四章 酸碱滴定法 第五章 配位滴定法 第六章 氧化还原滴定法 第七章 沉淀滴定法和重量分析法 第八章 电位法和永停滴定法 第九章 光谱分析法概论 第十章 紫外可见分光光度法 第十一章 荧光分析法 第十 ...

  • 在这里输入标题小学三年级下册写字教案(毛笔字部分
  • 小学三年级下册写字教案(毛笔字部分 2012-05-08 19:41:24|  分类:默认分类 |举报 |字号 第一课基本笔画(1) 写字教案(毛笔字部分) 教学要求: .使学生掌握斜钩和卧钩以及带有这些笔画的单字的书写要领. .培养学生良好的书写习惯和学习习惯. .在书写训练中进行爱学习的教育. ...

  • 一年级数学教学进度表
  • 身处在瞬息万变的社会中, 应该求创新, 加强能力, 居安思危, 无论你发展得多好, 时刻都要做好预备. 钱 一年级下册数学教学进度表 (2008-2009学年第二学期) 周 次 教 学 内 容 一 十几减9 ① 练习一 ② 十几减8.7 ① 机动 ① 二 练习二② 十几减6.5.4.3.2① 练习三 ...

  • 2015年英语类3D电子书(题库)
  • 2015年英语类3D电子书(题库)共428种 英语类考试 大学英语考试 大学英语四级               1.[圣才视频]大学英语四级考试真题解析班(网授)[免费下载] 8.[3D题库]2015年12月大学英语四级题库[历年真题+章节题库+模拟试题][免费下载] ...

  • 2015年上海市"上海市民防知识网络知识竞赛"大数据分析报告
  • "上海市民防知识网络知识竞赛"大数据分析报告 由上海市人民防空办公室.上海市国防教育办公室.上海市教育委员会组织的"上海市民防知识网络知识竞赛"已于日前落下帷幕,本次竞赛共有39221名用户登记,33444名用户参赛完成答题,全民竞赛网也从竞赛数据库中,查询出 ...