本文以2010年我国各地区城镇居民家庭平均每人全年消费性支出为例.选取了具有代表性的八大指标:食品——X 1;衣着——X 2;居住——X 3;家庭设备用品及服务——X 4;交通和通讯——X 5:文教娱乐用品及务——X 6;医疗保健——X 7;其他商品和服务——X 8。
数据分析和计算
各对变量之间的相关系数
用SAS 编程生成聚类产生的树形图形如下:
结果显示可把这八个变量分为三类,分别为第一类:食品、居住、家庭设备用品及服务、
交通和通讯;第二类:教娱乐用品及务、其他商品和服务;第三类:衣着、医疗保健。
3.2.1聚类分析样本与指标的确定
现在分别用最短距离法、重心法、类平均法和离差平法和法对我国2010年各地区进行聚类分析。为了同等的对待每一变量,在聚类之前,先必须对各变量作标准化变换。用SAS 软件编写程序生成的四种聚类方法的树形图,如下图所示,从图1至图4。
图1:最短距离法
图2:重心法
图3:类平均法
图4:WARD 最小方差法(离差平方和距离法)
图1,最短距离法,它将31个地区分为如下四类: 第一类:北京、浙江、上海
第二类:天津、福建、广东
第三类:河北、河南、湖南、宁夏、安徽、江西、山西、四川、广西、
湖北、陕西、重庆、贵州、甘肃、云南、新疆、海南、辽宁、黑龙江、吉林、内
蒙古、青海、山东、西藏
第四类:江苏
图2,重心法,它将31个地区分为如下三类: 第一类:北京、浙江、上海
第二类:天津、福建、广东、江苏
第三类:河北、河南、湖南、宁夏、安徽、江西、山西、四川、广西、
湖北、陕西、重庆、贵州、甘肃、云南、新疆、海南、辽宁、黑龙江、吉林、内蒙古、青海、山东、西藏
图3,类平均法,它将31个地区分为如下四类: 第一类:北京、浙江、上海
第二类:天津、福建、广东、江苏
第三类:河北、河南、湖南、宁夏、安徽、江西、山西、四川、广西、
湖北、陕西、重庆、海南、辽宁、黑龙江、吉林、内蒙古、青海、山东
第四类:贵州、甘肃、云南、新疆、西藏
图4,W ARD 最小方差法(离差平方和距离法),它将31个地区分为如下四五类:
第一类:北京、浙江、上海
第二类:天津、福建、广东、江苏
第三类:河北、河南、湖南、宁夏、安徽、江西、四川、广西、湖北、
陕西、重庆、海南、青海
第四类:山西、吉林、内蒙古、辽宁、黑龙江、山东 第五类:贵州、甘肃、云南、新疆、西藏
本文以2010年我国各地区城镇居民家庭平均每人全年消费性支出为例.选取了具有代表性的八大指标:食品——X 1;衣着——X 2;居住——X 3;家庭设备用品及服务——X 4;交通和通讯——X 5:文教娱乐用品及务——X 6;医疗保健——X 7;其他商品和服务——X 8。
数据分析和计算
各对变量之间的相关系数
用SAS 编程生成聚类产生的树形图形如下:
结果显示可把这八个变量分为三类,分别为第一类:食品、居住、家庭设备用品及服务、
交通和通讯;第二类:教娱乐用品及务、其他商品和服务;第三类:衣着、医疗保健。
3.2.1聚类分析样本与指标的确定
现在分别用最短距离法、重心法、类平均法和离差平法和法对我国2010年各地区进行聚类分析。为了同等的对待每一变量,在聚类之前,先必须对各变量作标准化变换。用SAS 软件编写程序生成的四种聚类方法的树形图,如下图所示,从图1至图4。
图1:最短距离法
图2:重心法
图3:类平均法
图4:WARD 最小方差法(离差平方和距离法)
图1,最短距离法,它将31个地区分为如下四类: 第一类:北京、浙江、上海
第二类:天津、福建、广东
第三类:河北、河南、湖南、宁夏、安徽、江西、山西、四川、广西、
湖北、陕西、重庆、贵州、甘肃、云南、新疆、海南、辽宁、黑龙江、吉林、内
蒙古、青海、山东、西藏
第四类:江苏
图2,重心法,它将31个地区分为如下三类: 第一类:北京、浙江、上海
第二类:天津、福建、广东、江苏
第三类:河北、河南、湖南、宁夏、安徽、江西、山西、四川、广西、
湖北、陕西、重庆、贵州、甘肃、云南、新疆、海南、辽宁、黑龙江、吉林、内蒙古、青海、山东、西藏
图3,类平均法,它将31个地区分为如下四类: 第一类:北京、浙江、上海
第二类:天津、福建、广东、江苏
第三类:河北、河南、湖南、宁夏、安徽、江西、山西、四川、广西、
湖北、陕西、重庆、海南、辽宁、黑龙江、吉林、内蒙古、青海、山东
第四类:贵州、甘肃、云南、新疆、西藏
图4,W ARD 最小方差法(离差平方和距离法),它将31个地区分为如下四五类:
第一类:北京、浙江、上海
第二类:天津、福建、广东、江苏
第三类:河北、河南、湖南、宁夏、安徽、江西、四川、广西、湖北、
陕西、重庆、海南、青海
第四类:山西、吉林、内蒙古、辽宁、黑龙江、山东 第五类:贵州、甘肃、云南、新疆、西藏