判别分析
判别分析是一种常用的统计分析方法,根据观察或测量到若干变量值,判别研究对象属于哪一类的方法。
实验:实验数据见:判别分析2010.sav.
例1:一个城市的居民家庭,按其有无割草机可分为两组,有割草机的记为一组为1,没有割草机的一组记为2,割草机工厂欲判断一些家庭是否购买割草机。从1和2分别随机抽取12个样品,调查两项指标:x1家庭收入,x2房前屋后土地面积。
用y作为二元被解释变量,有割草机的家庭用1表示,没有割草机的家庭用0表示,x1,x2作为解释变量。 实验步骤:
打开判别分析2010.sav,之后选择判别分析。
选择变量,定义范围
选用逐步判别法
在“统计量”中作相应选择
在“方法”栏中作相应选择
在“分类”中作相应选择
在“保存”中作相应选择
输出分析:表1
分析案例处理摘要
未加权案例 有效 排除的
缺失或越界组代码 至少一个缺失判别变量 缺失或越界组代码还有至少一个缺失判别变量 合计
合计
N
百分比 表1反映的是有效样本量及变量缺失的情况,从表中可见没有变量缺失。
表2是各族变量的描述统计分析。
表3是对各组均值是否相等的检验,由表可见在0.01的显著性水平上我们拒绝变量x1,x2,在两组的均值相等的假设。即认为变量x1,x2在两组的均值是有极显著性差异的。 表4反应的是协方差矩阵的秩和行列式的对数值。由行列式值可以看出协方差矩阵不是病态矩阵。 表5
检验结果
箱的 M F
近似。 df1 df2 Sig.
对相等总体协方差矩阵的零假设进行检验。
表5是对各总体协方差阵是否相等的统计检验,我们在0.05的显著性水平下没有足够的理由拒绝原假设,即:各总体协方差阵相等,因为0.803>0.05. 表6反映判别函数的特征值,解释方差的比例和典型相关系数。 表7
表7是对第一个判别函数的显著性检验,由Wilks‘Lambda检验,认为判别函数在0.01
的显著水平上极显著。
表8
标准化的典型判别式函数系
数
VAR00001 VAR00002
函数 1 表8是标准化的判别函数,
表示为y0.806x*10.785x*2,这里x*1,x*2为x1,x2的标准
化变量,标准化化变量的系数也就是前面讲的判别权重。 表9是结构矩阵,即判别载荷。由判别权重和判别载荷可以看出两个解释变量对判别函数的贡献较大。 表10
典型判别式函数系数
函数 1
VAR00001 VAR00002 (常量) 非标准化系数
表10是非标准化的判别函数,表示为y10.5080.145x10.759x2。我们可以根
据这个判别函数计算每个观测的判别Z得分。
表11是反映判别函数在各组的重心,根据结果,判别函数在y=0这一组的重心为-1.034,在y=1这一组的重心为1.034.由于两组大小相同,由前面临界分割点的公式,可以计算得到临界分割点为0,这样,我们就可以根据每个观测的判别Z得分将观测进行分类。 表12
分类处理摘要
已处理的 已排除的
缺失或越界组代码 至少一个缺失判别变量
用于输出中
表12概括分类过程,说明24个观测都参与分类。
表13说明各组的先验概率,在此选择的是所有组的先验概率相等。 表14是每组的分类函数,由表中结果可说明,y=0这一组的分类函数是
f151.4210.988x19.363x2,y=1这组的分类函数是
f273.1601.2890.988x110.934x2,可以计算出每个观测在各组的分类函数值,然
后将观测分类到较大的分类函数值中。
练习题:
多元统计分析书中,127页例4-2,试验数据为world95.sav.
判别分析
判别分析是一种常用的统计分析方法,根据观察或测量到若干变量值,判别研究对象属于哪一类的方法。
实验:实验数据见:判别分析2010.sav.
例1:一个城市的居民家庭,按其有无割草机可分为两组,有割草机的记为一组为1,没有割草机的一组记为2,割草机工厂欲判断一些家庭是否购买割草机。从1和2分别随机抽取12个样品,调查两项指标:x1家庭收入,x2房前屋后土地面积。
用y作为二元被解释变量,有割草机的家庭用1表示,没有割草机的家庭用0表示,x1,x2作为解释变量。 实验步骤:
打开判别分析2010.sav,之后选择判别分析。
选择变量,定义范围
选用逐步判别法
在“统计量”中作相应选择
在“方法”栏中作相应选择
在“分类”中作相应选择
在“保存”中作相应选择
输出分析:表1
分析案例处理摘要
未加权案例 有效 排除的
缺失或越界组代码 至少一个缺失判别变量 缺失或越界组代码还有至少一个缺失判别变量 合计
合计
N
百分比 表1反映的是有效样本量及变量缺失的情况,从表中可见没有变量缺失。
表2是各族变量的描述统计分析。
表3是对各组均值是否相等的检验,由表可见在0.01的显著性水平上我们拒绝变量x1,x2,在两组的均值相等的假设。即认为变量x1,x2在两组的均值是有极显著性差异的。 表4反应的是协方差矩阵的秩和行列式的对数值。由行列式值可以看出协方差矩阵不是病态矩阵。 表5
检验结果
箱的 M F
近似。 df1 df2 Sig.
对相等总体协方差矩阵的零假设进行检验。
表5是对各总体协方差阵是否相等的统计检验,我们在0.05的显著性水平下没有足够的理由拒绝原假设,即:各总体协方差阵相等,因为0.803>0.05. 表6反映判别函数的特征值,解释方差的比例和典型相关系数。 表7
表7是对第一个判别函数的显著性检验,由Wilks‘Lambda检验,认为判别函数在0.01
的显著水平上极显著。
表8
标准化的典型判别式函数系
数
VAR00001 VAR00002
函数 1 表8是标准化的判别函数,
表示为y0.806x*10.785x*2,这里x*1,x*2为x1,x2的标准
化变量,标准化化变量的系数也就是前面讲的判别权重。 表9是结构矩阵,即判别载荷。由判别权重和判别载荷可以看出两个解释变量对判别函数的贡献较大。 表10
典型判别式函数系数
函数 1
VAR00001 VAR00002 (常量) 非标准化系数
表10是非标准化的判别函数,表示为y10.5080.145x10.759x2。我们可以根
据这个判别函数计算每个观测的判别Z得分。
表11是反映判别函数在各组的重心,根据结果,判别函数在y=0这一组的重心为-1.034,在y=1这一组的重心为1.034.由于两组大小相同,由前面临界分割点的公式,可以计算得到临界分割点为0,这样,我们就可以根据每个观测的判别Z得分将观测进行分类。 表12
分类处理摘要
已处理的 已排除的
缺失或越界组代码 至少一个缺失判别变量
用于输出中
表12概括分类过程,说明24个观测都参与分类。
表13说明各组的先验概率,在此选择的是所有组的先验概率相等。 表14是每组的分类函数,由表中结果可说明,y=0这一组的分类函数是
f151.4210.988x19.363x2,y=1这组的分类函数是
f273.1601.2890.988x110.934x2,可以计算出每个观测在各组的分类函数值,然
后将观测分类到较大的分类函数值中。
练习题:
多元统计分析书中,127页例4-2,试验数据为world95.sav.