成 绩 评 定 表
课程设计任务书
随着经济的飞速发展,居民的住房问题日益突出,就各地区农村居民的住房情况进行调查,为了更好的将我们学过的知识运用到实际中所以我们可以运用学过的应用多元统计分析和SPSS软件对各地区农村居民住房进行因子分析。
关键词:住房问题,因子分析
1.设计问题 .................................... 1 2.设计原理 .................................... 1 3.设计分析 .................................... 1 4.设计结果 .................................... 3 5.设计总结 .................................... 8 参考文献 ....................................... 8
1.设计问题
随着我国社会经济的发展,人口的增多,居民的住房问题逐渐凸现出来,就我国各地区的农村居民住房问题的研究来说明各地区的经济发展和农村人口数等关系?
2.设计原理
因子分析根据变量之间相关性的大小,对变量进行分组,使得组内的变量之间相关性较高,而组间变量的相关性较低。每组变量代表一个基本结构,即公共因子。从而将众多变量转换为少数几个公共因子。计算样本在各个公共因子上的得分,可以挖掘出样本的问题所在。通过计算样本的加权公共因子得分,可以对样本进行综合评价。因子分析的一般模型如下:
X1a11F1a12F2a1mFm1XaFaFaF12112222mm2
(1)
Xpap1F1ap2F2apmFmp
一般而言,m远少于p,m的选取一般根据相关系数矩阵特征根大于1的个数来确定。其中因子分析的出发点是相关系数矩阵,上述因子载荷系数aij可以基于主成分法、主轴因子法、极大似然法、综合最小平方法或a因子法等方法进行估计。通过回归法或Bartlett法等建立公共因子与原始变量的线性组合,从而求得各因子的得分。
3.设计分析
1.在spss中输入数据,如下图:
表_3.1 各地区农村居民家庭住房情况 (2011年)
河 北 山 西 内蒙古
辽 宁 吉 林 黑龙江
上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东
河 南 湖 北 湖 南 广 东 广 西 海 南
重 庆 四 川 贵 州 云 南 西 藏
陕 西
34.11 684.38 29.92 547.44 24.25
479.53
28.86 813.82 24.44 585.09 24.82
813.15
58.90 2372.36 49.34 833.19 61.38 1280.05 34.59 591.84 49.82 791.05 46.02 469.12 36.31
552.19
36.45 493.11 44.24 538.02 46.40 431.89 30.73 832.44 34.90 454.41 24.22
842.09
39.73 454.11 37.71 489.55 29.41 519.81 30.88 573.20 28.47
314.52
35.76
613.65
9.66 22.96 7.30 18.95 1.23 16.72 6.61 21.70 0.16 22.72 0.82 20.38 21.91 36.97 26.20 23.00 43.04 16.87 20.13 13.95 36.42 10.32 37.03 7.29 11.19 24.45 19.29 16.61 24.90 15.00 20.71 23.89 23.75 4.75 27.57 5.52 11.07 13.07 18.54 17.06 16.65 14.62 10.79 14.70 8.80 7.09 0.76 14.07 17.83
11.04
2.再打开分析菜单找出因子分析,如下图:
在spss中的分析菜单中找到因子分析,并将住房价值,住房面积,住房结构(混泥土结构,木质结构)设为变量。
3.调整各项指标如(描述,抽取,旋转,得分,选项),并进行分析。
4.设计结果
4.1 得出以下结果
在SPSS中得到表4_1到4_5. 因子分析
4个变量中提取
公因子如表4_1所示。
共因子的要求。
X10.922F10.315F2
X20.724F10.524F2X30.700F10.701F2X40.515F10.779F2
从成份矩阵表4_3中可以看出,每个因子在不同的原始变量上的载荷没有明显的差
4_4.
在指标X1,X3上有较大载荷,说明这两项指标有较强的相关性,可以归为一类属于住房 各地区农村人口和农村面积的指标。第二个公因子在指标X2,X4上有较大载荷,同理可 以将这两个指标归为一类,属于各地区农村经济水平的指标。
根据表4_5的因子得分系数和原始变量的标准化值可以计算每个观测值的各因子的得分 数,并可以据此对观测量进行进一步的分析。下面得出旋转后的因子得分表达式写出:
F10.472X10.046X20.553X30.139X4F20.101X10.490X20.170X30.566X4
比较直观的得出每个观测值的碎石图和成分图如图所示:
地 区 全 国 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江
36.24 38.08 30.22 34.11 29.92 24.25 28.86 24.44 24.82 58.90 49.34 61.38
F1 F2
654.37 16.48 15.92 0.01288 -0.22072
2101.58 10.48 27.44 1.36788 1.96012 1600.45 5.70 24.50 0.42657 1.72249 684.38 9.66 22.96 -0.00830 0.66390 547.44 7.30 18.95 -0.49521 0.44326 479.53 1.23 16.72 -1.04057 0.59500
813.82 6.61 21.70 -0.27285 0.90490 585.09 0.16 22.72 -0.77849 1.16981 813.15 0.82 20.38 -0.65897 1.13015
2372.36 21.91 36.97 3.12163 1.97093 833.19 26.20 23.00 1.23190 -0.22920 1280.05 43.04 16.87 2.34438
-1.30945
安 徽 34.59 591.84 20.13 13.95 -0.06813 -0.53286
福 建 49.82 791.05 36.42 10.32 1.07417 -1.65630
江 西 46.02 469.12 37.03 7.29 0.58941 -2.07408
山 东 36.31 552.19 11.19 24.45 0.08650 0.56675
河 南 36.45 493.11 19.29 16.61 0.00910 -0.41114
湖 北 44.24 538.02 24.90 15.00 0.48314 -0.89721
湖 南 46.40 431.89 20.71 23.89 0.68788 -0.17651
广 东 30.73 832.44 23.75 4.75 -0.27652 -1.11571
广 西 34.90 454.41 27.57 5.52 -0.23417 -1.59110
海 南 24.22 842.09 11.07 13.07 -0.62494 0.18650
重 庆 39.73 454.11 18.54 17.06 0.11688 -0.44540
四 川 37.71 489.55 16.65 14.62 -0.08345 -0.48222
贵 州 29.41 519.81 10.79 14.70 -0.58507 -0.03404
云 南 30.88 573.20 8.80 7.09 -0.80329 -0.51933
西 藏 28.47 314.52 0.76 14.07 -1.08206 0.19766
陕 西 35.76 613.65 17.83 11.04 -0.16791 -0.66717
甘 肃 23.65 537.26 4.12 9.30 -1.19898 -0.03142
青 海 26.81 461.27 2.48 11.48 -1.08862 0.07710
宁 夏 24.38 480.91 1.73 16.59 -1.02449 0.56218
新 疆 26.14 452.36 2.30 13.47 -1.06031 0.24312
2.对以上结果进行分析
由以上表格可以得出;排第一的是上海,第二是北京„„
可以看出来,农村的住房面积跟所在地区的农村人口成反比,跟所在地区的经济呈线性关系 农村的住房价格跟所在地区的经济水平呈正相关。
5.设计总结
通过这次课程设计,我知道了因子分析在解决实际问题中有很重要的意义,有些实际问 题解决起来很复杂麻烦,但通过因子以及SPSS软件的结合应用,就能很清楚的得到解决 ,给我们带来了很大的方便。我也更加熟悉了因子分析相关知识以及SPSS软件的应用, 并能很好的运用到实际中去。
通过这次的设计我更加熟悉了用计算机软件来解决数学问题,很多的数学问解决起来很 复杂,但是应用计算机软件就可以轻松的解决这些问题,用SPSS中自带的软件非常方便。而 且通过本次的设计我彻底的了解了因子分析的意义以及应用,我也会学习更多的数学相关知识 ,并运用到学习和生活中,相信这对我今后的学习和生活都会有很大的帮助。
参考文献
(1)《应用多元统计分析》,朱建平
(2)中国统计局年鉴
成 绩 评 定 表
课程设计任务书
随着经济的飞速发展,居民的住房问题日益突出,就各地区农村居民的住房情况进行调查,为了更好的将我们学过的知识运用到实际中所以我们可以运用学过的应用多元统计分析和SPSS软件对各地区农村居民住房进行因子分析。
关键词:住房问题,因子分析
1.设计问题 .................................... 1 2.设计原理 .................................... 1 3.设计分析 .................................... 1 4.设计结果 .................................... 3 5.设计总结 .................................... 8 参考文献 ....................................... 8
1.设计问题
随着我国社会经济的发展,人口的增多,居民的住房问题逐渐凸现出来,就我国各地区的农村居民住房问题的研究来说明各地区的经济发展和农村人口数等关系?
2.设计原理
因子分析根据变量之间相关性的大小,对变量进行分组,使得组内的变量之间相关性较高,而组间变量的相关性较低。每组变量代表一个基本结构,即公共因子。从而将众多变量转换为少数几个公共因子。计算样本在各个公共因子上的得分,可以挖掘出样本的问题所在。通过计算样本的加权公共因子得分,可以对样本进行综合评价。因子分析的一般模型如下:
X1a11F1a12F2a1mFm1XaFaFaF12112222mm2
(1)
Xpap1F1ap2F2apmFmp
一般而言,m远少于p,m的选取一般根据相关系数矩阵特征根大于1的个数来确定。其中因子分析的出发点是相关系数矩阵,上述因子载荷系数aij可以基于主成分法、主轴因子法、极大似然法、综合最小平方法或a因子法等方法进行估计。通过回归法或Bartlett法等建立公共因子与原始变量的线性组合,从而求得各因子的得分。
3.设计分析
1.在spss中输入数据,如下图:
表_3.1 各地区农村居民家庭住房情况 (2011年)
河 北 山 西 内蒙古
辽 宁 吉 林 黑龙江
上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东
河 南 湖 北 湖 南 广 东 广 西 海 南
重 庆 四 川 贵 州 云 南 西 藏
陕 西
34.11 684.38 29.92 547.44 24.25
479.53
28.86 813.82 24.44 585.09 24.82
813.15
58.90 2372.36 49.34 833.19 61.38 1280.05 34.59 591.84 49.82 791.05 46.02 469.12 36.31
552.19
36.45 493.11 44.24 538.02 46.40 431.89 30.73 832.44 34.90 454.41 24.22
842.09
39.73 454.11 37.71 489.55 29.41 519.81 30.88 573.20 28.47
314.52
35.76
613.65
9.66 22.96 7.30 18.95 1.23 16.72 6.61 21.70 0.16 22.72 0.82 20.38 21.91 36.97 26.20 23.00 43.04 16.87 20.13 13.95 36.42 10.32 37.03 7.29 11.19 24.45 19.29 16.61 24.90 15.00 20.71 23.89 23.75 4.75 27.57 5.52 11.07 13.07 18.54 17.06 16.65 14.62 10.79 14.70 8.80 7.09 0.76 14.07 17.83
11.04
2.再打开分析菜单找出因子分析,如下图:
在spss中的分析菜单中找到因子分析,并将住房价值,住房面积,住房结构(混泥土结构,木质结构)设为变量。
3.调整各项指标如(描述,抽取,旋转,得分,选项),并进行分析。
4.设计结果
4.1 得出以下结果
在SPSS中得到表4_1到4_5. 因子分析
4个变量中提取
公因子如表4_1所示。
共因子的要求。
X10.922F10.315F2
X20.724F10.524F2X30.700F10.701F2X40.515F10.779F2
从成份矩阵表4_3中可以看出,每个因子在不同的原始变量上的载荷没有明显的差
4_4.
在指标X1,X3上有较大载荷,说明这两项指标有较强的相关性,可以归为一类属于住房 各地区农村人口和农村面积的指标。第二个公因子在指标X2,X4上有较大载荷,同理可 以将这两个指标归为一类,属于各地区农村经济水平的指标。
根据表4_5的因子得分系数和原始变量的标准化值可以计算每个观测值的各因子的得分 数,并可以据此对观测量进行进一步的分析。下面得出旋转后的因子得分表达式写出:
F10.472X10.046X20.553X30.139X4F20.101X10.490X20.170X30.566X4
比较直观的得出每个观测值的碎石图和成分图如图所示:
地 区 全 国 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江
36.24 38.08 30.22 34.11 29.92 24.25 28.86 24.44 24.82 58.90 49.34 61.38
F1 F2
654.37 16.48 15.92 0.01288 -0.22072
2101.58 10.48 27.44 1.36788 1.96012 1600.45 5.70 24.50 0.42657 1.72249 684.38 9.66 22.96 -0.00830 0.66390 547.44 7.30 18.95 -0.49521 0.44326 479.53 1.23 16.72 -1.04057 0.59500
813.82 6.61 21.70 -0.27285 0.90490 585.09 0.16 22.72 -0.77849 1.16981 813.15 0.82 20.38 -0.65897 1.13015
2372.36 21.91 36.97 3.12163 1.97093 833.19 26.20 23.00 1.23190 -0.22920 1280.05 43.04 16.87 2.34438
-1.30945
安 徽 34.59 591.84 20.13 13.95 -0.06813 -0.53286
福 建 49.82 791.05 36.42 10.32 1.07417 -1.65630
江 西 46.02 469.12 37.03 7.29 0.58941 -2.07408
山 东 36.31 552.19 11.19 24.45 0.08650 0.56675
河 南 36.45 493.11 19.29 16.61 0.00910 -0.41114
湖 北 44.24 538.02 24.90 15.00 0.48314 -0.89721
湖 南 46.40 431.89 20.71 23.89 0.68788 -0.17651
广 东 30.73 832.44 23.75 4.75 -0.27652 -1.11571
广 西 34.90 454.41 27.57 5.52 -0.23417 -1.59110
海 南 24.22 842.09 11.07 13.07 -0.62494 0.18650
重 庆 39.73 454.11 18.54 17.06 0.11688 -0.44540
四 川 37.71 489.55 16.65 14.62 -0.08345 -0.48222
贵 州 29.41 519.81 10.79 14.70 -0.58507 -0.03404
云 南 30.88 573.20 8.80 7.09 -0.80329 -0.51933
西 藏 28.47 314.52 0.76 14.07 -1.08206 0.19766
陕 西 35.76 613.65 17.83 11.04 -0.16791 -0.66717
甘 肃 23.65 537.26 4.12 9.30 -1.19898 -0.03142
青 海 26.81 461.27 2.48 11.48 -1.08862 0.07710
宁 夏 24.38 480.91 1.73 16.59 -1.02449 0.56218
新 疆 26.14 452.36 2.30 13.47 -1.06031 0.24312
2.对以上结果进行分析
由以上表格可以得出;排第一的是上海,第二是北京„„
可以看出来,农村的住房面积跟所在地区的农村人口成反比,跟所在地区的经济呈线性关系 农村的住房价格跟所在地区的经济水平呈正相关。
5.设计总结
通过这次课程设计,我知道了因子分析在解决实际问题中有很重要的意义,有些实际问 题解决起来很复杂麻烦,但通过因子以及SPSS软件的结合应用,就能很清楚的得到解决 ,给我们带来了很大的方便。我也更加熟悉了因子分析相关知识以及SPSS软件的应用, 并能很好的运用到实际中去。
通过这次的设计我更加熟悉了用计算机软件来解决数学问题,很多的数学问解决起来很 复杂,但是应用计算机软件就可以轻松的解决这些问题,用SPSS中自带的软件非常方便。而 且通过本次的设计我彻底的了解了因子分析的意义以及应用,我也会学习更多的数学相关知识 ,并运用到学习和生活中,相信这对我今后的学习和生活都会有很大的帮助。
参考文献
(1)《应用多元统计分析》,朱建平
(2)中国统计局年鉴