主成分分析方法在区域经济研究中的应用

第24卷 第2期

2001年6月

干旱区地理

ARID LAND GEOGRAPHY

Vol. 24 No. 2Jun. 2001

文章编号:1000-6060(2001) 02-0157-04

*

主成分分析方法在区域经济研究中的应用

) ) ) 以新疆为例¹

高志刚 韩延玲

(新疆财经学院经济学系、统计与信息管理系, 乌鲁木齐 830012)

提 要 主成分分析方法(PCA) 及采用此法做综合评价的原理和步骤, 并用两个方面的实例具体阐述了主成分分析方法在区域经济研究中的应用, 最后对这种方法的特点及应用中须注意的问题进行了初步总结。

关键词 主成分分析方法 区域经济中图分类号 F61. 5 文献标识码 A

1 主成分分析方法(PCA ) 简介

主成分分析方法(Principal Component Analy -sis) , 简称PCA, 是通过原始变量的线性组合, 把多个原始指标减化为有代表意义的少数几个指标, 以

使原始指标能更集中更典型地表明研究对象特征的一种统计方法。为什么要减化原始指标? 主要是因为各原始指标之间往往不是相互独立的, 而不同程度地存在着某种相关关系(这种情况在实际问题中一般是不可避免的) , 要不使这些相关性造成原始指标信息重叠, 降低指标作用, 对以后的计算产生误差, 就必须在高维空间中加以研究, 这显然是比较麻烦的。为克服此困难, 很自然就会想到降维的方法, 即利用全部p 个指标来重新构造m 个新的综合指标(一般m 比p 要小得多) , 以使这些较少的且相互之间又是独立的指标能尽可能地多反映原始指标的统计特性和信息量。此外, 如何将多指标综合为一个统一的评价值, 这实质上就是怎样科学地确定各个指标的权重问题。主成分分析方法正是在这两方面显示了其独特的作用。

采用主成分分析方法做综合评价, 其原理和步骤如下11, 22:

(1) 建立n 个区域p 个指标的原始数据矩阵

M ij (i =1, 2, , , n; j =1, 2, , , p ) , 并对其进行无量纲化或标准化处理, 一般采用Z -score 法无量纲化, 得到M .

ij

矩阵。对正指标有:Z ij =(X ij -

X j ) /S j ; 则对逆指标有:Z ij =(X j -X ij ) /S j ,

N n

(X ij -X j ) 其中:X j =2X , S j =2=1n i =1ij n

(2) 计算指标的相关系数矩阵R j k 。

n i j j ik k n

R j k =2=2Z Z , 且

n i=1S j S k n i=1ij ik

有R jj =1, R j k =R kj

(3) 求特征值K k (k =1, 2, , , p ) 和特征向量L k (k =1, 2, , , p ) 。根据特征方程|R -K I |=0计算特征值K k , 并列出特征值K k 的特征向量L k 。

(4) 计算贡献率T k =K k /2K i 和累积贡献率D k

j =1

k

p

=j =21T j , 选取D k \90%的特征值K 1, K 2, , , K m (m

(5) 计算主成分指标的权重W j 。把第m 个主成分特征值的累积贡献率D m 定为1, 算出T 1, T 2, , , T m 所对应的新的T . 1, T . 2, , , T . m , 即为主成分指标的权重值。

(6) 计算主成分得分矩阵Y ij (i =1, 2, , , n; j =1, 2, , , m ) 。

¹*国家自然科学基金项目(70063005) 资助。

作者简介:高志刚, 男, 1972年12月生, 博士, 副教授, 主要从事区域经济、产业经济等领域的研究与教学。已在5资源科学6、5经济地理6、5干旱区地理6和5人文地理6等刊物上发表论文20余篇, 合著专著1部, 参编2部。:2001-08

干 旱 区 地 理 24卷158

(7) 根据多指标加权综合评价模型F i =

p j=1

区) , 从而为制定区域经济持续发展战略和宏观调控区域经济, 缩小经济差距, 达到全疆共同富裕, 提供依据和参考。

表1 相关系数矩阵的特征值、贡献率和累积贡献率Tab. 1Characteristic values, contributing rates and cumulative

contributing rates of correlation coef ficient matrix

主成分

1

2

3

4

5

6

7

8

9

10

2W j Y i j (i =1, 2, , , n; j =1, 2, , , p ) 计算综合

评价值, 其中W j 为第j 个指标的权重, Y ij 表示第i 个区域单元的第j 个指标的单项评价值, 此时W j =T . j (j =1, 2, , , m ) , Y ij 即是主成分得分矩阵(i =1, 2, , , n; j =1, 2, , , m ) 。

2 PCA 在区域经济研究中的应用

2. 1 在市县经济发展综合实力研究中的应用

进行新疆市县经济发展综合实力评价值的计算, 必须选取合适的指标体系, 以综合反映一个市或县的经济发展水平。为此, 从规模、结构、效益、基础设施、城镇化水平、科技实力、人口素质等方面共选取了20项指标。指标体系如下:P 1国内生产总值; P 2工业产值; P 3农业产值; P 4第三产业产值; P 5基本建设投资; P 6人均国内生产总值; P 7人均工业产值; P 8人均基本建设投资; P 9人均财政收入; P 10财政自给率; P 11二产与一产比率; P 12三产比重; P 13百元资产实现产值; P 14产值利税率; P 15非农人口比例; P 16城镇密度; P 17科技人员率; P 18每千人高中以上文化程度人数; P 19每千人医务人员数; P 20文盲及半文盲比率。

通过对87个市县的原始数据采用PCA 方法并用统计软件上机处理, 可得到以下主要结果:(1) 相关系数矩阵的特征值、贡献率和累积贡献率(表1) 。

(2) 主成分荷载矩阵(略) 。

(3) 主成分得分矩阵(略) 。

根据选取主成分的原则(累积贡献率(90%) , 选取前7个主成分, 并计算其权重W j (j =1, 2, , , 7) 分别是0. 519、0. 150、0. 097、0. 073、0. 066、0. 050、0. 045。从所有主成分得分矩阵中选取前7个主成分的得分矩阵Y ij (i =1, 2, , , 87; j =1, 2, , , 7) , 根据多指标综合评价模型, 则得到各个市县的经济发展实力综合评价值。为使评价值均为正数, 且易于划分梯度区间, 故采用一定方法将得到的评价值进行变换, 通过排序得到综合评价排序表(表2) 。

在此基础上, 就可进一步研究新疆市县经济发展水平的空间地域分异规律并进行经济发展梯度分区13, 42

特征值贡献率

9. 39002. 74151. 70361. 32631. 20670. 89160. 82940. 58260. 43050. 28030. 4690. 1370. 0850. 0660. 0600. 0450. 0410. 0290. 0220. 014

累积贡献率0. 4690. 6070. 6920. 7580. 8180. 8630. 9040. 9340. 9550. 969主成分特征值贡献率

11

12

13

14

15

16

17

18

19

20

0. 24630. 14400. 08110. 06050. 03800. 02500. 01340. 00610. 00240. 00070. 0120. 0070. 0040. 0030. 0020. 0010. 0010. 0000. 0000. 000

累积贡献率0. 9810. 9890. 9930. 9960. 9980. 9991. 0001. 0001. 0001. 000

表2 新疆市县经济发展综合实力评价值及排序Tab. 2C omprerhensive evaluatiion values and sort of economic

development of cities and counties in Xinjiang

市县

位次1

市县额敏

值位次24. 6223

市县昭苏焉耆库车托里温泉泽普巴里坤阿合奇

值位次19. 484519. 394619. 244719. 064818. 694918. 555018. 495118. 4452

市县乌恰沙雅新和莎车拜城岳普湖柯坪叶城

值位次16. 616716. 086815. 936915. 827015. 577115. 307215. 207314. 8474

乌鲁木齐市100

克拉玛依市85. 042和布克赛尔24. 3224库尔勒市59. 023鄯善昌吉市哈密市

38. 59434. 56533. 566

若羌尉犁精河轮台新源福海且末富蕴

22. 672522. 102622. 012721. 842821. 522921. 5030

石河子市32. 447奎屯市

32. 238

阿克苏市32. 169玛纳斯喀什市伊宁市阜康市塔城市沙湾米泉市

30. 6010

21. 3831阿图什市18. 2553塔什库尔干14. 347521. 3432察布查尔18. 1554

博湖伊宁县尼勒克木垒温宿麦盖提阿瓦提特克斯巩留青河巴楚民丰

18. 055517. 855617. 845717. 545817. 405917. 316017. 246117. 236217. 026316. 966416. 956516. 7766

伽师策勒疏勒皮山乌什疏附英吉沙洛浦阿克陶和田县墨玉于田

14. 017613. 817713. 757813. 617913. 428013. 258112. 868212. 618312. 598412. 49859. 06868. 0387

28. 7011吉木萨尔21. 313328. 561228. 441326. 821426. 701526. 3316

和田市吉木乃哈巴河和硕托克逊和静奇台霍城布尔津裕民伊吾

21. 073420. 913520. 663620. 653720. 483820. 453920. 264019. 944119. 824219. 694319. 5844

阿勒泰市25. 9317博乐市

25. 7918

乌鲁木齐县25. 3819吐鲁番市25. 0820乌苏市呼图壁

24. 842124. 7522

2. 2 在主导产业选择中的应用152

2期 高志刚等:主成分分析方法在区域经济研究中的应用 159

展较快的开放区域, 也是经济发展水平较高的区域, 已经初步形成较为完善的工业结构体系。新疆处于中国向西开放的前沿, 又作为大陆桥西部桥头堡和21世纪资源战略接替地, 如何发展沿线区域的工业, 促进产业高级化, 并带动全疆的经济发展是值得研究的问题。其中, 沿线区域主导产业的选择是至关重要的。

主导产业的选择一般要考虑如下原则:市场需求及潜力原则、比较优势及要素禀赋原则、产业间的关联性原则、产业优势原则。在选择方法上笔者主要采用了基于主成分分析的多指标综合评价法, 并且结合区位商结果和各产业的现实规模, 最终选出了新亚欧大陆桥沿线区域的主导工业。指标体系如下:X 1行业产值, X 2行业增加值, X 3年未资产总计, X 4产品销售收入, X 5专门化率, X 6产值利税率, X 7固定资产利用率, 这些指标基本能综合反映各产业的规模、竞争力、影响力和部门效益。

模型为:F i =

2W j Y ij (i =1, 2, , , n ; j =1, j =1

p

油工业、化学工业; 石河子市:纺织工业、食品工业、造纸及文教用品工业; 哈密地区:煤炭工业、化学工业、建材工业、冶金工业; 吐鲁番地区:石油工业、化

学工业、食品工业、冶金工业; 昌吉州:食品工业、电力工业、纺织工业、机械工业; 博州:纺织工业、建材工业、食品工业

为了验证计算结果是否科学、合理, 笔者还计算了各产业的区位商(表4) , 同时对照自治区计委及有关人员的规划和研究成果162(表5) , 可以看出, 此定量分析的结果与前人的规划及定性研究成果基本一致, 说明定量分析结果是可信的。

表4 陆桥沿线区域各地州产业区位商

Tab. 4Industrial location quotients in the regions along

the new Eurasian continental bridge

部门冶金工业煤炭工业石油工业化学工业机械工业建材工业电力工业食品工业纺织工业¹

乌鲁木齐克拉玛依石河子2. 0580. 6940. 7031. 3651. 9731. 0250. 8820. 4640. 894

3. 1990. 4290. 0830. 1410. 0000. 0060. 0030. 0110. 1550. 000

0. 0031. 0450. 5090. 0911. 4871. 4213. 2243. 0680. 1530. 264

0. 000

哈密1. 8497. 1830. 0092. 1720. 3542. 6871. 3730. 4900. 7280. 2410. 4120. 220

吐鲁番1. 0022. 3241. 7531. 6210. 1760. 9250. 4630. 6880. 0120. 2890. 0990. 212

昌吉1. 1382. 2050. 0250. 7281. 6561. 3112. 7681. 5741. 1971. 6741. 3210. 160

0. 5190. 2612. 1532. 0992. 6552. 1990. 3380. 8140. 404博州0. 024

2, , , p ) , 其中Wj 为第j 个指标的权重, Y ij 表示第i 行业部门第j 个指标的单项评价值。

采用主成分分析方法计算(具体过程略) , 得出沿线各主要地州、各产业的综合评价值(表3) 。

表3 陆桥沿线区域各地州产业综合评价值Tab. 3Industrial comprehensive evaluation values in the regions along the new Eurasian continental bridge

部门冶金工业煤炭工业石油工业化学工业机械工业建材工业电力工业食品工业纺织工业¹造纸工业º森林工业其他

乌鲁木齐克拉玛依石河子4. 671. 704. 713. 884. 932. 562. 092. 484. 242. 152. 011. 00

1. 081. 001. 291. 267. 301. 541. 271. 421. 45

6. 501. 942. 812. 191. 773. 153. 537. 003. 331. 951. 00

哈密3. 102. 641. 354. 181. 633. 872. 262. 382. 791. 631. 001. 37

吐鲁番2. 293. 636. 992. 431. 171. 761. 651. 501. 001. 241. 251. 20

1. 002. 073. 333. 224. 814. 864. 622. 322. 071. 52

1. 941. 693. 093. 444. 375. 011. 901. 711. 50

昌吉2. 58

博州1. 00

造纸工业º0. 895森林工业其他

0. 8920. 425

注:¹包括皮革工业; º包括文教用品制造业。上表根据新疆第三次工业普查资料计算整理而得。

表5 自治区有关部门的规划及定性研究结果Tab. 5Planning and qualitative results of the

department concerned in X injiang

/九五0及其以后重点发展的产业

乌鲁木齐市克拉玛依市石河子市哈密地区吐鲁番地区昌吉州博州

石油工业、化学工业、机械工业、纺织工业、食品工业、建材工业石油工业、化学工业、机械工业、建材工业

纺织工业、食品工业、造纸工业、电力工业、化学工业、机械工业煤炭工业、化学工业、冶金工业、建材工业、纺织工业石油工业、化学工业、冶金工业、食品工业

纺织工业、食品工业、电力工业、建材工业、机械工业、化学工业纺织工业、食品工业、建材工业

注:¹包括皮革工业; º包括文教用品制造业。上表根据新疆第三次工业普查资料计算整理而得。

资料来源:根据文献162中有关论述整理

根据综合评价值, 可初步选择出陆桥沿线区域各地州的主导产业:乌鲁木齐市:机械工业、石油工

干 旱 区 地 理 24卷160

主成分分析法只适用于原始指标之间存在一定相关

3 结论

PCA 用于多指标综合评价有以下特点:(1) 消除了原始指标之间的相关影响, 使计算结果更为精确。(2) 降维简化了原始指标体系, 且能尽可能地多反映原始指标的统计特性和信息量。(3) 在将原始指标变换为主成分的过程中, 很容易得到包含信息量的主成分权重, 这比人为确定权重工作量小, 而且权重是伴随数学变换生成的, 不能人为调整, 这也有助于客观地反映指标之间的现实关系。

当然在应用主成分分析法过程中还须注意以下问题:(1) 当原始指标对于所研究的目标是正指标时, 可直接运用主成分方法选取主成分并进行加权、综合, 计算综合评价值; 如果原始指标对于所研究的目标是逆指标时, 就必须在标准化前进行逆向处理。(2) 选出的主成分m 要远远小于原始p, 否则应用主成分分析法既毫无意义也无法导出正确结果。(3)

关系和数量化指标的评价系统, 对于不相关的或非数量化指标的系统不适用。(4) 由于权重是样本的函数, 是随样本集的变化而变化, 因此在不同的样本集中, 同一指标的权重是不同的。

112 张超, 杨秉赓编著. 计量地理学基础1M 2. 北京:高等教育出版

社, 1985.

122 邱东. 多指标综合评价方法的系统分析1M 2. 北京:中国统计出

版社, 1991.

132 高志刚, 韩延玲, 韩德麟. 新疆市县经济发展梯度研究1J 2. 经济

地理, 2000, (20) 1.

142 高志刚, 韩德麟. 新疆市县经济差异与可持续发展研究1C 2.

见:中国地理学会编, 区域可持续发展研究. 北京:中国环境科学出版社, 1997.

152 高志刚. 新亚欧大陆桥(新疆段) 沿线区域工业发展研究1J 2. 经

济地理, 1999, (19) 6.

162 韩学琦. 新疆经济开发现在与未来1M 2. 北京:经济管理出版

社, 1996.

APPLICATION O F PRINCIPAL COMPONENT ANALYS IS IN REGIONAL

ECONOMY:TAKING XINJIANG AS AN EXAMPLE

GAO Zh-i gang HAN Yan -ling

(X inj iang Institute o f Finance &Economy, De p artment of Ec onomics, Urum qi 830012, China)

Abstract

In this paper, authors introduce simply principle and procedure of the method of principal component analy -sis (PCA) and use tw o ex amples to set forth concretely the application of PCA in reg ional econom y. The first is to adopt the method of principal component analysis to appraise the economic developmental level of all counties

in Xinjiang, the second is to adopt the method of principal component analysis to select the leading industries in the regions along the new Eurasian continental bridge (Xinjiang . s section) . The two ex amples show the method of principal com ponent analysis is suitable and feasible for regional economy dealing with comprehensive apprecia -tion. This method has the follow ing characteristics:(1) The correlation effect betw een the original indicators is removed and the result is more accurate. (2) The orig inal indicators system is simplified and the new system covers the information and statistical features of the original indicators system as more as possible. (3) The rig ht w eightiness of the new indicators is obtained easily in the course of calculation and it is not be affected by some man -made factors. At last authors remind readers to need to be paid attention to four problems in the applica -tion. Among them, the most im portant one is that this m ethod is not suitable for the in -correlative and non -quantitative indicators system.

第24卷 第2期

2001年6月

干旱区地理

ARID LAND GEOGRAPHY

Vol. 24 No. 2Jun. 2001

文章编号:1000-6060(2001) 02-0157-04

*

主成分分析方法在区域经济研究中的应用

) ) ) 以新疆为例¹

高志刚 韩延玲

(新疆财经学院经济学系、统计与信息管理系, 乌鲁木齐 830012)

提 要 主成分分析方法(PCA) 及采用此法做综合评价的原理和步骤, 并用两个方面的实例具体阐述了主成分分析方法在区域经济研究中的应用, 最后对这种方法的特点及应用中须注意的问题进行了初步总结。

关键词 主成分分析方法 区域经济中图分类号 F61. 5 文献标识码 A

1 主成分分析方法(PCA ) 简介

主成分分析方法(Principal Component Analy -sis) , 简称PCA, 是通过原始变量的线性组合, 把多个原始指标减化为有代表意义的少数几个指标, 以

使原始指标能更集中更典型地表明研究对象特征的一种统计方法。为什么要减化原始指标? 主要是因为各原始指标之间往往不是相互独立的, 而不同程度地存在着某种相关关系(这种情况在实际问题中一般是不可避免的) , 要不使这些相关性造成原始指标信息重叠, 降低指标作用, 对以后的计算产生误差, 就必须在高维空间中加以研究, 这显然是比较麻烦的。为克服此困难, 很自然就会想到降维的方法, 即利用全部p 个指标来重新构造m 个新的综合指标(一般m 比p 要小得多) , 以使这些较少的且相互之间又是独立的指标能尽可能地多反映原始指标的统计特性和信息量。此外, 如何将多指标综合为一个统一的评价值, 这实质上就是怎样科学地确定各个指标的权重问题。主成分分析方法正是在这两方面显示了其独特的作用。

采用主成分分析方法做综合评价, 其原理和步骤如下11, 22:

(1) 建立n 个区域p 个指标的原始数据矩阵

M ij (i =1, 2, , , n; j =1, 2, , , p ) , 并对其进行无量纲化或标准化处理, 一般采用Z -score 法无量纲化, 得到M .

ij

矩阵。对正指标有:Z ij =(X ij -

X j ) /S j ; 则对逆指标有:Z ij =(X j -X ij ) /S j ,

N n

(X ij -X j ) 其中:X j =2X , S j =2=1n i =1ij n

(2) 计算指标的相关系数矩阵R j k 。

n i j j ik k n

R j k =2=2Z Z , 且

n i=1S j S k n i=1ij ik

有R jj =1, R j k =R kj

(3) 求特征值K k (k =1, 2, , , p ) 和特征向量L k (k =1, 2, , , p ) 。根据特征方程|R -K I |=0计算特征值K k , 并列出特征值K k 的特征向量L k 。

(4) 计算贡献率T k =K k /2K i 和累积贡献率D k

j =1

k

p

=j =21T j , 选取D k \90%的特征值K 1, K 2, , , K m (m

(5) 计算主成分指标的权重W j 。把第m 个主成分特征值的累积贡献率D m 定为1, 算出T 1, T 2, , , T m 所对应的新的T . 1, T . 2, , , T . m , 即为主成分指标的权重值。

(6) 计算主成分得分矩阵Y ij (i =1, 2, , , n; j =1, 2, , , m ) 。

¹*国家自然科学基金项目(70063005) 资助。

作者简介:高志刚, 男, 1972年12月生, 博士, 副教授, 主要从事区域经济、产业经济等领域的研究与教学。已在5资源科学6、5经济地理6、5干旱区地理6和5人文地理6等刊物上发表论文20余篇, 合著专著1部, 参编2部。:2001-08

干 旱 区 地 理 24卷158

(7) 根据多指标加权综合评价模型F i =

p j=1

区) , 从而为制定区域经济持续发展战略和宏观调控区域经济, 缩小经济差距, 达到全疆共同富裕, 提供依据和参考。

表1 相关系数矩阵的特征值、贡献率和累积贡献率Tab. 1Characteristic values, contributing rates and cumulative

contributing rates of correlation coef ficient matrix

主成分

1

2

3

4

5

6

7

8

9

10

2W j Y i j (i =1, 2, , , n; j =1, 2, , , p ) 计算综合

评价值, 其中W j 为第j 个指标的权重, Y ij 表示第i 个区域单元的第j 个指标的单项评价值, 此时W j =T . j (j =1, 2, , , m ) , Y ij 即是主成分得分矩阵(i =1, 2, , , n; j =1, 2, , , m ) 。

2 PCA 在区域经济研究中的应用

2. 1 在市县经济发展综合实力研究中的应用

进行新疆市县经济发展综合实力评价值的计算, 必须选取合适的指标体系, 以综合反映一个市或县的经济发展水平。为此, 从规模、结构、效益、基础设施、城镇化水平、科技实力、人口素质等方面共选取了20项指标。指标体系如下:P 1国内生产总值; P 2工业产值; P 3农业产值; P 4第三产业产值; P 5基本建设投资; P 6人均国内生产总值; P 7人均工业产值; P 8人均基本建设投资; P 9人均财政收入; P 10财政自给率; P 11二产与一产比率; P 12三产比重; P 13百元资产实现产值; P 14产值利税率; P 15非农人口比例; P 16城镇密度; P 17科技人员率; P 18每千人高中以上文化程度人数; P 19每千人医务人员数; P 20文盲及半文盲比率。

通过对87个市县的原始数据采用PCA 方法并用统计软件上机处理, 可得到以下主要结果:(1) 相关系数矩阵的特征值、贡献率和累积贡献率(表1) 。

(2) 主成分荷载矩阵(略) 。

(3) 主成分得分矩阵(略) 。

根据选取主成分的原则(累积贡献率(90%) , 选取前7个主成分, 并计算其权重W j (j =1, 2, , , 7) 分别是0. 519、0. 150、0. 097、0. 073、0. 066、0. 050、0. 045。从所有主成分得分矩阵中选取前7个主成分的得分矩阵Y ij (i =1, 2, , , 87; j =1, 2, , , 7) , 根据多指标综合评价模型, 则得到各个市县的经济发展实力综合评价值。为使评价值均为正数, 且易于划分梯度区间, 故采用一定方法将得到的评价值进行变换, 通过排序得到综合评价排序表(表2) 。

在此基础上, 就可进一步研究新疆市县经济发展水平的空间地域分异规律并进行经济发展梯度分区13, 42

特征值贡献率

9. 39002. 74151. 70361. 32631. 20670. 89160. 82940. 58260. 43050. 28030. 4690. 1370. 0850. 0660. 0600. 0450. 0410. 0290. 0220. 014

累积贡献率0. 4690. 6070. 6920. 7580. 8180. 8630. 9040. 9340. 9550. 969主成分特征值贡献率

11

12

13

14

15

16

17

18

19

20

0. 24630. 14400. 08110. 06050. 03800. 02500. 01340. 00610. 00240. 00070. 0120. 0070. 0040. 0030. 0020. 0010. 0010. 0000. 0000. 000

累积贡献率0. 9810. 9890. 9930. 9960. 9980. 9991. 0001. 0001. 0001. 000

表2 新疆市县经济发展综合实力评价值及排序Tab. 2C omprerhensive evaluatiion values and sort of economic

development of cities and counties in Xinjiang

市县

位次1

市县额敏

值位次24. 6223

市县昭苏焉耆库车托里温泉泽普巴里坤阿合奇

值位次19. 484519. 394619. 244719. 064818. 694918. 555018. 495118. 4452

市县乌恰沙雅新和莎车拜城岳普湖柯坪叶城

值位次16. 616716. 086815. 936915. 827015. 577115. 307215. 207314. 8474

乌鲁木齐市100

克拉玛依市85. 042和布克赛尔24. 3224库尔勒市59. 023鄯善昌吉市哈密市

38. 59434. 56533. 566

若羌尉犁精河轮台新源福海且末富蕴

22. 672522. 102622. 012721. 842821. 522921. 5030

石河子市32. 447奎屯市

32. 238

阿克苏市32. 169玛纳斯喀什市伊宁市阜康市塔城市沙湾米泉市

30. 6010

21. 3831阿图什市18. 2553塔什库尔干14. 347521. 3432察布查尔18. 1554

博湖伊宁县尼勒克木垒温宿麦盖提阿瓦提特克斯巩留青河巴楚民丰

18. 055517. 855617. 845717. 545817. 405917. 316017. 246117. 236217. 026316. 966416. 956516. 7766

伽师策勒疏勒皮山乌什疏附英吉沙洛浦阿克陶和田县墨玉于田

14. 017613. 817713. 757813. 617913. 428013. 258112. 868212. 618312. 598412. 49859. 06868. 0387

28. 7011吉木萨尔21. 313328. 561228. 441326. 821426. 701526. 3316

和田市吉木乃哈巴河和硕托克逊和静奇台霍城布尔津裕民伊吾

21. 073420. 913520. 663620. 653720. 483820. 453920. 264019. 944119. 824219. 694319. 5844

阿勒泰市25. 9317博乐市

25. 7918

乌鲁木齐县25. 3819吐鲁番市25. 0820乌苏市呼图壁

24. 842124. 7522

2. 2 在主导产业选择中的应用152

2期 高志刚等:主成分分析方法在区域经济研究中的应用 159

展较快的开放区域, 也是经济发展水平较高的区域, 已经初步形成较为完善的工业结构体系。新疆处于中国向西开放的前沿, 又作为大陆桥西部桥头堡和21世纪资源战略接替地, 如何发展沿线区域的工业, 促进产业高级化, 并带动全疆的经济发展是值得研究的问题。其中, 沿线区域主导产业的选择是至关重要的。

主导产业的选择一般要考虑如下原则:市场需求及潜力原则、比较优势及要素禀赋原则、产业间的关联性原则、产业优势原则。在选择方法上笔者主要采用了基于主成分分析的多指标综合评价法, 并且结合区位商结果和各产业的现实规模, 最终选出了新亚欧大陆桥沿线区域的主导工业。指标体系如下:X 1行业产值, X 2行业增加值, X 3年未资产总计, X 4产品销售收入, X 5专门化率, X 6产值利税率, X 7固定资产利用率, 这些指标基本能综合反映各产业的规模、竞争力、影响力和部门效益。

模型为:F i =

2W j Y ij (i =1, 2, , , n ; j =1, j =1

p

油工业、化学工业; 石河子市:纺织工业、食品工业、造纸及文教用品工业; 哈密地区:煤炭工业、化学工业、建材工业、冶金工业; 吐鲁番地区:石油工业、化

学工业、食品工业、冶金工业; 昌吉州:食品工业、电力工业、纺织工业、机械工业; 博州:纺织工业、建材工业、食品工业

为了验证计算结果是否科学、合理, 笔者还计算了各产业的区位商(表4) , 同时对照自治区计委及有关人员的规划和研究成果162(表5) , 可以看出, 此定量分析的结果与前人的规划及定性研究成果基本一致, 说明定量分析结果是可信的。

表4 陆桥沿线区域各地州产业区位商

Tab. 4Industrial location quotients in the regions along

the new Eurasian continental bridge

部门冶金工业煤炭工业石油工业化学工业机械工业建材工业电力工业食品工业纺织工业¹

乌鲁木齐克拉玛依石河子2. 0580. 6940. 7031. 3651. 9731. 0250. 8820. 4640. 894

3. 1990. 4290. 0830. 1410. 0000. 0060. 0030. 0110. 1550. 000

0. 0031. 0450. 5090. 0911. 4871. 4213. 2243. 0680. 1530. 264

0. 000

哈密1. 8497. 1830. 0092. 1720. 3542. 6871. 3730. 4900. 7280. 2410. 4120. 220

吐鲁番1. 0022. 3241. 7531. 6210. 1760. 9250. 4630. 6880. 0120. 2890. 0990. 212

昌吉1. 1382. 2050. 0250. 7281. 6561. 3112. 7681. 5741. 1971. 6741. 3210. 160

0. 5190. 2612. 1532. 0992. 6552. 1990. 3380. 8140. 404博州0. 024

2, , , p ) , 其中Wj 为第j 个指标的权重, Y ij 表示第i 行业部门第j 个指标的单项评价值。

采用主成分分析方法计算(具体过程略) , 得出沿线各主要地州、各产业的综合评价值(表3) 。

表3 陆桥沿线区域各地州产业综合评价值Tab. 3Industrial comprehensive evaluation values in the regions along the new Eurasian continental bridge

部门冶金工业煤炭工业石油工业化学工业机械工业建材工业电力工业食品工业纺织工业¹造纸工业º森林工业其他

乌鲁木齐克拉玛依石河子4. 671. 704. 713. 884. 932. 562. 092. 484. 242. 152. 011. 00

1. 081. 001. 291. 267. 301. 541. 271. 421. 45

6. 501. 942. 812. 191. 773. 153. 537. 003. 331. 951. 00

哈密3. 102. 641. 354. 181. 633. 872. 262. 382. 791. 631. 001. 37

吐鲁番2. 293. 636. 992. 431. 171. 761. 651. 501. 001. 241. 251. 20

1. 002. 073. 333. 224. 814. 864. 622. 322. 071. 52

1. 941. 693. 093. 444. 375. 011. 901. 711. 50

昌吉2. 58

博州1. 00

造纸工业º0. 895森林工业其他

0. 8920. 425

注:¹包括皮革工业; º包括文教用品制造业。上表根据新疆第三次工业普查资料计算整理而得。

表5 自治区有关部门的规划及定性研究结果Tab. 5Planning and qualitative results of the

department concerned in X injiang

/九五0及其以后重点发展的产业

乌鲁木齐市克拉玛依市石河子市哈密地区吐鲁番地区昌吉州博州

石油工业、化学工业、机械工业、纺织工业、食品工业、建材工业石油工业、化学工业、机械工业、建材工业

纺织工业、食品工业、造纸工业、电力工业、化学工业、机械工业煤炭工业、化学工业、冶金工业、建材工业、纺织工业石油工业、化学工业、冶金工业、食品工业

纺织工业、食品工业、电力工业、建材工业、机械工业、化学工业纺织工业、食品工业、建材工业

注:¹包括皮革工业; º包括文教用品制造业。上表根据新疆第三次工业普查资料计算整理而得。

资料来源:根据文献162中有关论述整理

根据综合评价值, 可初步选择出陆桥沿线区域各地州的主导产业:乌鲁木齐市:机械工业、石油工

干 旱 区 地 理 24卷160

主成分分析法只适用于原始指标之间存在一定相关

3 结论

PCA 用于多指标综合评价有以下特点:(1) 消除了原始指标之间的相关影响, 使计算结果更为精确。(2) 降维简化了原始指标体系, 且能尽可能地多反映原始指标的统计特性和信息量。(3) 在将原始指标变换为主成分的过程中, 很容易得到包含信息量的主成分权重, 这比人为确定权重工作量小, 而且权重是伴随数学变换生成的, 不能人为调整, 这也有助于客观地反映指标之间的现实关系。

当然在应用主成分分析法过程中还须注意以下问题:(1) 当原始指标对于所研究的目标是正指标时, 可直接运用主成分方法选取主成分并进行加权、综合, 计算综合评价值; 如果原始指标对于所研究的目标是逆指标时, 就必须在标准化前进行逆向处理。(2) 选出的主成分m 要远远小于原始p, 否则应用主成分分析法既毫无意义也无法导出正确结果。(3)

关系和数量化指标的评价系统, 对于不相关的或非数量化指标的系统不适用。(4) 由于权重是样本的函数, 是随样本集的变化而变化, 因此在不同的样本集中, 同一指标的权重是不同的。

112 张超, 杨秉赓编著. 计量地理学基础1M 2. 北京:高等教育出版

社, 1985.

122 邱东. 多指标综合评价方法的系统分析1M 2. 北京:中国统计出

版社, 1991.

132 高志刚, 韩延玲, 韩德麟. 新疆市县经济发展梯度研究1J 2. 经济

地理, 2000, (20) 1.

142 高志刚, 韩德麟. 新疆市县经济差异与可持续发展研究1C 2.

见:中国地理学会编, 区域可持续发展研究. 北京:中国环境科学出版社, 1997.

152 高志刚. 新亚欧大陆桥(新疆段) 沿线区域工业发展研究1J 2. 经

济地理, 1999, (19) 6.

162 韩学琦. 新疆经济开发现在与未来1M 2. 北京:经济管理出版

社, 1996.

APPLICATION O F PRINCIPAL COMPONENT ANALYS IS IN REGIONAL

ECONOMY:TAKING XINJIANG AS AN EXAMPLE

GAO Zh-i gang HAN Yan -ling

(X inj iang Institute o f Finance &Economy, De p artment of Ec onomics, Urum qi 830012, China)

Abstract

In this paper, authors introduce simply principle and procedure of the method of principal component analy -sis (PCA) and use tw o ex amples to set forth concretely the application of PCA in reg ional econom y. The first is to adopt the method of principal component analysis to appraise the economic developmental level of all counties

in Xinjiang, the second is to adopt the method of principal component analysis to select the leading industries in the regions along the new Eurasian continental bridge (Xinjiang . s section) . The two ex amples show the method of principal com ponent analysis is suitable and feasible for regional economy dealing with comprehensive apprecia -tion. This method has the follow ing characteristics:(1) The correlation effect betw een the original indicators is removed and the result is more accurate. (2) The orig inal indicators system is simplified and the new system covers the information and statistical features of the original indicators system as more as possible. (3) The rig ht w eightiness of the new indicators is obtained easily in the course of calculation and it is not be affected by some man -made factors. At last authors remind readers to need to be paid attention to four problems in the applica -tion. Among them, the most im portant one is that this m ethod is not suitable for the in -correlative and non -quantitative indicators system.


相关内容

  • pieters-基于光谱反射法定量分析行星表面矿物
  • 基于光谱反射法定量分析行星表面矿物 摘要:应用反射光谱可以对矿物成分进行多种远程分析,如:测得岩石单位的岩性,辨别矿物表面成分,定量分析且定性分析大量矿物的表面成分.目前,有三种截然不同的方法用于辨别并定量分析,其简要实例:(1)实证方法.这主要包括与波谱库的波谱比较或是匹配.波谱库里的矿物波谱是已 ...

  • 基于断裂点模型的物流节点空间吸引范围划分研究
  • 基于断裂点模型的物流节点空间吸引范围划分研究 基于断裂点模型的物流节点空间吸引范围划分研究 王 勇,李康宁,刘 永,林 鹰 (重庆交通大学 经济与管理学院,重庆 400074) 摘要: 基于断裂点模型和泰森多边形理论,研究物流节点空间吸引范围划分问题.根据物流节点的特性,考虑物流节点的区位条件和规模 ...

  • 持续发展能力评价--以江苏省为例
  • [区域经济] 基于主成分分析的区域可持续发展能力评价 --以江苏省为例 ●李朝旗1,李朝赞2,刘沛2 (1.南京大学 国土资源与旅游学系,南京210093:2.东南大学公共卫生学院,南京210009) 内容提要:科学评价江苏省区域可持续发展能力是制定其发展战略的基础.通过建立江苏省区域可持续发展指标 ...

  • 巢湖水质时空分布模式研究
  • 第4卷 第3期2010年3月 环境工程学报 Vol. 4, No. 3Mar. 2010 巢湖水质时空分布模式研究 谢 森 何连生 1 23 田学达 席北斗 陈 林 于会彬 1232 (11湘潭大学环境工程系, 湘潭411105; 21中国环境科学研究院, 北京100012; 31西华师范大学国土资 ...

  • 遥感变化监测流程
  • 多时相土地利用/覆盖变化监测研究 方法及数据选取 土地是一个综合的自然地理概念,它处于地圈-生物圈-大气圈相互作用的界面,是各种自然过程和人类活动最为活跃的场所.地球表层系统最突出的景观标志就是土地利用和土地覆盖( Land Use and Land Cover).由于土地利用和土地覆盖与人类的生活 ...

  • 格林公式的教学教法探讨
  • 垫塑塑:!: 创新教育ScienceandTechnOlOgy|nnOvatiOnHerald 格林公式的教学教法探讨 冒庆祝 (广西师范大学数学科学学院广西桂林541004) 摘要:表文根据教学目标分析格棒公式的麓学摩点,探讨格球公式的曩学忑蓐,井依鲁相应的曩学忑蓐蛤出曩学过程的设计.关键词:橹椿 ...

  • 遥感监测土地覆盖变化的方法及研究进展_韩涛
  • 第22卷 第2期 干 旱 气 象 Vol.22 NO.22004年6月Jun,2004ARIDMETEOROLOGY文章编号:1006-7639(2004)-02-0076-06 遥感监测土地覆盖变化的方法及研究进展 韩 涛1,2 (1.中国气象局兰州干旱气象研究所,甘肃兰州 730020;2. 7 ...

  • 基于主成分分析法的长沙市土地生态安全评价
  • 摘 要:近年来随着经济社会的发展,土地利用强度和利用方式发生了变化,造成了土地污染和人地矛盾的加剧.因此,文章采用主成分分析法对2013年长沙市土地生态安全进行评价,选取了8项代表性的评价因子,构建长沙市土地生态安全评价体系.结果显示:产业结构.人口结构.城市化水平是影响长沙市生态安全状况的关键因素 ...

  • 浅论地理学与生态学研究在应对全球变化中的作用与应用
  • 浅论地理学与生态学研究在应对全球变化中的作用与应用 近代以来,各种全球变化受到人们的关注,例如人们最关心的全球气候变化,以及人口增长.地表覆被变化.水资源短缺.生物多样性减少等等.这些问题也引起地理学家和生态学家的广泛关注和研究,并取得了一系列重大成果.本文就地理学和生态学在全球变化中的作用与应用进 ...