2000年10月
文章编号:100026788(2000) 1020089204
系统工程理论与实践第10期
确定事例特征权值的方法研究
吴良刚1, 高 阳1, 张金隆2
(1. 中南工业大学工商管理学院, 湖南长沙410083; 2. 华中理工大学科研处, 湖北武汉430074)
摘要: 针对事例特征权值的确定问题, 提出了D elph i 和A H P 相结合的权值确定方法, 以及二次规
划模型权值确定法和信用统计权值确定法Λ这些方法在事例特征权值的确定中, 有助于减少主观性, 增加客观性Λ
关键词: 事例推理; 事例特征权值; 层次分析法; 二次规划中图分类号: T P 18 α
R esearch fo r M ethods D eterm in ing the
W eigh ts of Case Characteristics
112
W U L iang 2gang , GAO Yang , ZHAN G J in 2long
(1. T he In stitu te of Bu siness and A dm in istrati on , CSU T , Changsha 410083; 2. D ivisi on , HU ST , W uhan 430074)
Scien tific R esearch
Abstract : In o rder to determ ine the w eigh ts of case characteristics , the paper p resen ts the m ethods of com b in ing D elph i w ith A H P , quadratic p rogramm ing and credit
. T he m ethods con tribu te to decrease sub jective and increase ob jective in statistics
. determ in ing the w eigh ts of case characteristics
Keywords : case 2based reason ing ; w eigh ts of case characteristic ; analytical h ierarchy p rocess ; quadratic p rogramm ing
1 引言
事例推理(Case 2Based R eason ing , CBR ) 技术是A I 中一种新兴的推理方法ΛCBR 基于人的认知过程, 即人类求解某一新问题时, 往往把以前使用过的与该问题类似的事例联系起来, 运用过去解决该事例的经验和方法, 来解决当前问题ΛCBR 就象人们找医生看病那样, 总是喜欢找老医生, 特别是老中医, 其原因就是老医生看过的病例多, 经验丰富Λ基于事例的方法为传统的知识处理系统问题的解决提供了一条有效的途径Λ
事例是由组成事例的特征结构来表达的Λ事例中各个特征的重要性是不同的Λ一般是用事例特征权值的大小来描述事例特征的重要程度Λ事例特征权值在CBR 方法中有其广泛的应用, 例如事例的相似度计算、事例的索引等方面Λ在很多CBR 应用系统中, 事例特征权值的确定都是由专家主观确定的, 缺乏一定的客观性Λ本文针对这一问题提出了事例特征权值确定的几种方法Λ这些方法是针对多个专家及大量的事例来确定事例特征权值Λ
2 D elph i 法和AHP 法相结合确定权值
由一个专家确定各特征的权值带有很大的主观性, 为了减少这种主观性, 我们采用D elph i 法由多个专
α
收稿日期:1999203217
资助项目:国家自然科学基金(79770036)
90系统工程理论与实践2000年10月
家确定各特征两两之间的相对重要程度, 再由A H P (A nalytical H ierarchy P rocess ) 法确定各特征的权值, 其具体步骤如下:
设每个事例包含有n 个特征, 有p 个专家Λ
1) 采用D elph i 问卷调查方式向p 个专家问卷调查, 其问卷形式设计如下:
特征 1 2 … n
1 2
b 11
b 12b 22
…b 1n …b 2n ω
b
n
[1]
这里b ij 的取值范围Saaty 建议为1~9, 且b j i =1 b ij Ζ例如, b ij =5表示第i 特征相对于第j 特征的重要程度值为5, 说明第j 特征比第i 特征重要; b ij =1 5表示第i 特征相对于第j 特征的重要程度值为5, 说明第i 特征比第j 特征重要Ζ
2) 综合P 个专家的意见或观点Ζ我们用几何平均值法来综合专家的意见或观点Ζ由第(1) 步, 可得p 个专家对各事例特征两两之间相对重要程度的打分表, 设a r ij 表示第r 个专家确定的第i 事例特征相对于第j
2事例特征的重要程度值, 则a 1…, a p a ij 、ij 、ij 分别表示p 个专家确定的第i 事例特征相对于第j 特征的重要程度值, 令
a ij =
7
p
a r ij
1 p
r =1
a ij =反映了p 个专家确定第i 事例特征相对于第j 事例特征重要程度的平均值Ζ
3) 构造事例特征相互重要程度的判断矩阵Ζ由第(2) 步的方法确定每个a ij , i =1, 2, …, n ; j =1, 2, …, n , 则就构成了事例特征相互重要程度的判断矩阵Ζ
A =(a ij ) n ×n
其中a ij =1 a j i , a ii =1
4) 用A H P 法确定各特征的权值ΖA H P 法确定各特征权值用如下公式计算:
W i =
n 6
n
j =1
6
n
a k j
i =1, 2, …, n (1)
k =1
由(1) 式可得各特征权值的向量W =(W 1, W 2, …, W n ) T , W 具有如下性质:
性质1 A W =ΚW , 这里Κm ax m ax 是矩阵A 的最大特征值Ζ证明见参考文献[1]Ζ性质2 6W i =1
i =1n
证明
6
n
W i =
n
i =1
666
n
n n
i =1j =1
n
6
a ij
n
a k j
=
n 66
n n
i =1j =1
k =1
6
n
a k j
k =1
=
n
6
n
=a k j
n
j =1
6
n
l =1
j =1
k =1
上述步骤的计算过程见表1, 表2Ζ由表2可知五个特征的各数值分别为:0. 182, 0. 155, 0. 151, 0. 273,
0. 239.
第10期确定事例特征权值的方法研究
表1
91
a ij
1
12345
1. 0000. 3330. 3333. 0002. 000
K
23. 0001. 0000. 3331. 0004. 0009. 333
33. 0003. 0001. 0000. 3333. 00010. 333
40. 3331. 0003. 0001. 0000. 3335. 666
50. 5000. 2500. 3333. 0001. 0005. 083
特征
6. 666
表2
a ik K
6
特征1
0. 1500. 0500. 0500. 4500. 300
特征2
0. 3210. 1070. 0360. 1070. 429
特征3
0. 2910. 2910. 0970. 0300. 291
特征4
0. 0590. 1770. 5280. 1770. 059
特征5
0. 0980. 0490. 0450. 5910. 197
6
j W i =
56
j
特征1特征2特征3特征4特征5
0. 9110. 6470. 7561. 3651. 294
0. 1820. 1550. 1510. 2730. 239
3 二次规划模型权值确定法
上述用D elph i 法和A H P 法进行事例特征权值的确定主要是针对某一个事例的事例特征权值的确定Ζ对于同类型的问题, 在事例库中可能存在很多事例, 每个事例均有它们各自的事例特征权值Ζ为了更有效地确定该类型问题的事例特征权值, 需要综合该类问题各事例特征权值Ζ为此, 我们设该类型问题有m 个
(W i 1, W i 2, …, W ij , …, W in ) i =1, 2, …, m , 其中W ij 表示第i 事例, 每个事例有n 个事例特征ΖW ′i =
n
事例第j 事例特征的权值, W i 表示第i 事例的事例特征权值的分布, 且6W ij =1Ζ此外, 为了说明第i 事例
j =1
′
′
的事例特征权值分布W ′i 的好坏, 我们引入一个评价好坏的评估值(或信用值) r i , r i 值越大, 就说明W i 的数
值分布就越正确, 反之亦然Ζ这样就可得如下一组数据, 用W ′矩阵表示为:
W
W ′=
W
12
W
1121
W W W
1222
…W …W …W
1n 2n
r 1r 2r m
=
W (2)
m 1m 2m n
设X 1, X 2, …, X n 分别表示所需求的事例特征权值, 我们希望该权值的分布尽量接近评估值高的事例特征权值的分布Ζ因此可构造如下模型:
m in s . t .
6r 6
i
i =1n
m n
(X j -W ij ) 2
(3)
j =1
6
X j =1
j =1
X j ≥0
上述模型是一个二次规划模型
′′′
例1 W 1=(0. 3, 0. 5, 0. 2) , W 2=(0. 3, 0. 4, 0. 3) , W 3=(0. 2, 0. 6, 0. 2)
r 1=0. 9 r 2=0. 5 r 3=0. 1
代入上述模型, 用二次规划模型求解方法, 可得到X 1≈0. 28, X 2≈0. 48, X 3≈0. 24
92
4 信用统计法
系统工程理论与实践2000年10月
针对(2) 式的问题, 用二次规划模型求解事例特征权值需要具备数学规划领域的知识, 且求解过程比较繁琐Ζ下面我们提出一种信用统计法来确定事例特征权值, 该方法简单易懂, 其公式构造如下:
W
j
=
R 6
r i
m
r i W ij j =1, 2, …, n (4)
i =1
R =
W
j
6
n
m
i =1
表示第j 事例特征的权值, 并且有6W j =1Ζ
6
=
m
w j =
R
j =1
66
n
i =1m
r i w
ij
=
R
j =1i =1
66
n m
r i w
ij
=
R
i =1j =1
6r 6
i
i =1
n m
w
ij
j =1
R 6
m
r i =1
i =1
例2 由例(1) 中的数据, 代入(4) 式中, 可得W 1=0. 293, W 2=0. 473, W 3=0. 234Ζ
5 结束语
事例中各事例特征权值的正确确定, 在CBR 推理过程中起着重要的作用Λ例如在CBR 中的相似度计算、事例的检索等方面都需要用到事例特征的权值Λ而传统的事例特征的权值确定带有很大的主观性Λ为减少主观性, 增加额观性, 针对某一单个事例, 本文提出了D elph i 和A H P 相结合的权值确定法; 而针对事例库中的大量事例, 本文提出了二次规划模型权值确定法和信用统计权值确定法Λ这些方法提供了解决权值问题的一条途径Λ参考文献:
[1] Saaty T L . T he A nalytic H ierarchy P rocess :P lann ing , P ri o rity Setting [M ]. R esou rce A llocati on
M cGraw 2H ill , N ew Yo rk , 1980.
[2] M eade L M , L iles D H , Sark is J . Ju stifying Strategic A lliances and Partnering :a P rerequ isite fo r
~42. V irtual En terp rising [J ]. Om ega , In t J M gm t Sci , 1997, l 25(1) :29[3] L aw rence M Seifert , Joe Zhu . Iden tifying Excesses and D eficits in Ch inese Indu strial P roductivity
(1953-1990) :a W eigh ted D ata Envelopm en t A nalysis A pp roach [J ]. Om ega , In t . J . M gm t . Sci ,
1998, 26(2) :279~296. . (上接第83页)
[5] CasdagliM . N on linear p redicti on of chao tic ti ~356. m e series [J ]. Physica D , 1989, 35:335
[6] Gencay R . N on linear p redicti on of no isy ti . L ett A , m e series w ithfeedfo rw ard netw o rk s [J ]. Phys
1994, 187:397~403.
[7] Sm ith L A . Iden ticati on and p redicti on of low di ~m en si onal dynam ics [J ]. Physica D , 1992, 58:50
76.
[8] A lbano A M , Passam an te A , H ediger T , Farrell M E . U sing neu ral nets to look fo r chao s [J ].
~9. Physica D , 1992, 58:1
[9] Farm er J D . Chao tic attracto r of an infin ite 2di ~m en si on chao tic system [J ]. Physica D , 1982, 4:366
393.
[10] Sugihara G , M ay R M . N on linear fo recasting as a w ay of distingu ish ing chao s from m easu rem en t
~741. erro r in ti m e series [J ]. N atu re , 1990, 344:734
[11] A barbanel H D I , B row n R , Sido row ich J J , L Sh . T si m ring . T he analysis of ob served chao tic data
~1392. in physical system s [J ]. R ev M od Phys , 1993, 65:1331
2000年10月
文章编号:100026788(2000) 1020089204
系统工程理论与实践第10期
确定事例特征权值的方法研究
吴良刚1, 高 阳1, 张金隆2
(1. 中南工业大学工商管理学院, 湖南长沙410083; 2. 华中理工大学科研处, 湖北武汉430074)
摘要: 针对事例特征权值的确定问题, 提出了D elph i 和A H P 相结合的权值确定方法, 以及二次规
划模型权值确定法和信用统计权值确定法Λ这些方法在事例特征权值的确定中, 有助于减少主观性, 增加客观性Λ
关键词: 事例推理; 事例特征权值; 层次分析法; 二次规划中图分类号: T P 18 α
R esearch fo r M ethods D eterm in ing the
W eigh ts of Case Characteristics
112
W U L iang 2gang , GAO Yang , ZHAN G J in 2long
(1. T he In stitu te of Bu siness and A dm in istrati on , CSU T , Changsha 410083; 2. D ivisi on , HU ST , W uhan 430074)
Scien tific R esearch
Abstract : In o rder to determ ine the w eigh ts of case characteristics , the paper p resen ts the m ethods of com b in ing D elph i w ith A H P , quadratic p rogramm ing and credit
. T he m ethods con tribu te to decrease sub jective and increase ob jective in statistics
. determ in ing the w eigh ts of case characteristics
Keywords : case 2based reason ing ; w eigh ts of case characteristic ; analytical h ierarchy p rocess ; quadratic p rogramm ing
1 引言
事例推理(Case 2Based R eason ing , CBR ) 技术是A I 中一种新兴的推理方法ΛCBR 基于人的认知过程, 即人类求解某一新问题时, 往往把以前使用过的与该问题类似的事例联系起来, 运用过去解决该事例的经验和方法, 来解决当前问题ΛCBR 就象人们找医生看病那样, 总是喜欢找老医生, 特别是老中医, 其原因就是老医生看过的病例多, 经验丰富Λ基于事例的方法为传统的知识处理系统问题的解决提供了一条有效的途径Λ
事例是由组成事例的特征结构来表达的Λ事例中各个特征的重要性是不同的Λ一般是用事例特征权值的大小来描述事例特征的重要程度Λ事例特征权值在CBR 方法中有其广泛的应用, 例如事例的相似度计算、事例的索引等方面Λ在很多CBR 应用系统中, 事例特征权值的确定都是由专家主观确定的, 缺乏一定的客观性Λ本文针对这一问题提出了事例特征权值确定的几种方法Λ这些方法是针对多个专家及大量的事例来确定事例特征权值Λ
2 D elph i 法和AHP 法相结合确定权值
由一个专家确定各特征的权值带有很大的主观性, 为了减少这种主观性, 我们采用D elph i 法由多个专
α
收稿日期:1999203217
资助项目:国家自然科学基金(79770036)
90系统工程理论与实践2000年10月
家确定各特征两两之间的相对重要程度, 再由A H P (A nalytical H ierarchy P rocess ) 法确定各特征的权值, 其具体步骤如下:
设每个事例包含有n 个特征, 有p 个专家Λ
1) 采用D elph i 问卷调查方式向p 个专家问卷调查, 其问卷形式设计如下:
特征 1 2 … n
1 2
b 11
b 12b 22
…b 1n …b 2n ω
b
n
[1]
这里b ij 的取值范围Saaty 建议为1~9, 且b j i =1 b ij Ζ例如, b ij =5表示第i 特征相对于第j 特征的重要程度值为5, 说明第j 特征比第i 特征重要; b ij =1 5表示第i 特征相对于第j 特征的重要程度值为5, 说明第i 特征比第j 特征重要Ζ
2) 综合P 个专家的意见或观点Ζ我们用几何平均值法来综合专家的意见或观点Ζ由第(1) 步, 可得p 个专家对各事例特征两两之间相对重要程度的打分表, 设a r ij 表示第r 个专家确定的第i 事例特征相对于第j
2事例特征的重要程度值, 则a 1…, a p a ij 、ij 、ij 分别表示p 个专家确定的第i 事例特征相对于第j 特征的重要程度值, 令
a ij =
7
p
a r ij
1 p
r =1
a ij =反映了p 个专家确定第i 事例特征相对于第j 事例特征重要程度的平均值Ζ
3) 构造事例特征相互重要程度的判断矩阵Ζ由第(2) 步的方法确定每个a ij , i =1, 2, …, n ; j =1, 2, …, n , 则就构成了事例特征相互重要程度的判断矩阵Ζ
A =(a ij ) n ×n
其中a ij =1 a j i , a ii =1
4) 用A H P 法确定各特征的权值ΖA H P 法确定各特征权值用如下公式计算:
W i =
n 6
n
j =1
6
n
a k j
i =1, 2, …, n (1)
k =1
由(1) 式可得各特征权值的向量W =(W 1, W 2, …, W n ) T , W 具有如下性质:
性质1 A W =ΚW , 这里Κm ax m ax 是矩阵A 的最大特征值Ζ证明见参考文献[1]Ζ性质2 6W i =1
i =1n
证明
6
n
W i =
n
i =1
666
n
n n
i =1j =1
n
6
a ij
n
a k j
=
n 66
n n
i =1j =1
k =1
6
n
a k j
k =1
=
n
6
n
=a k j
n
j =1
6
n
l =1
j =1
k =1
上述步骤的计算过程见表1, 表2Ζ由表2可知五个特征的各数值分别为:0. 182, 0. 155, 0. 151, 0. 273,
0. 239.
第10期确定事例特征权值的方法研究
表1
91
a ij
1
12345
1. 0000. 3330. 3333. 0002. 000
K
23. 0001. 0000. 3331. 0004. 0009. 333
33. 0003. 0001. 0000. 3333. 00010. 333
40. 3331. 0003. 0001. 0000. 3335. 666
50. 5000. 2500. 3333. 0001. 0005. 083
特征
6. 666
表2
a ik K
6
特征1
0. 1500. 0500. 0500. 4500. 300
特征2
0. 3210. 1070. 0360. 1070. 429
特征3
0. 2910. 2910. 0970. 0300. 291
特征4
0. 0590. 1770. 5280. 1770. 059
特征5
0. 0980. 0490. 0450. 5910. 197
6
j W i =
56
j
特征1特征2特征3特征4特征5
0. 9110. 6470. 7561. 3651. 294
0. 1820. 1550. 1510. 2730. 239
3 二次规划模型权值确定法
上述用D elph i 法和A H P 法进行事例特征权值的确定主要是针对某一个事例的事例特征权值的确定Ζ对于同类型的问题, 在事例库中可能存在很多事例, 每个事例均有它们各自的事例特征权值Ζ为了更有效地确定该类型问题的事例特征权值, 需要综合该类问题各事例特征权值Ζ为此, 我们设该类型问题有m 个
(W i 1, W i 2, …, W ij , …, W in ) i =1, 2, …, m , 其中W ij 表示第i 事例, 每个事例有n 个事例特征ΖW ′i =
n
事例第j 事例特征的权值, W i 表示第i 事例的事例特征权值的分布, 且6W ij =1Ζ此外, 为了说明第i 事例
j =1
′
′
的事例特征权值分布W ′i 的好坏, 我们引入一个评价好坏的评估值(或信用值) r i , r i 值越大, 就说明W i 的数
值分布就越正确, 反之亦然Ζ这样就可得如下一组数据, 用W ′矩阵表示为:
W
W ′=
W
12
W
1121
W W W
1222
…W …W …W
1n 2n
r 1r 2r m
=
W (2)
m 1m 2m n
设X 1, X 2, …, X n 分别表示所需求的事例特征权值, 我们希望该权值的分布尽量接近评估值高的事例特征权值的分布Ζ因此可构造如下模型:
m in s . t .
6r 6
i
i =1n
m n
(X j -W ij ) 2
(3)
j =1
6
X j =1
j =1
X j ≥0
上述模型是一个二次规划模型
′′′
例1 W 1=(0. 3, 0. 5, 0. 2) , W 2=(0. 3, 0. 4, 0. 3) , W 3=(0. 2, 0. 6, 0. 2)
r 1=0. 9 r 2=0. 5 r 3=0. 1
代入上述模型, 用二次规划模型求解方法, 可得到X 1≈0. 28, X 2≈0. 48, X 3≈0. 24
92
4 信用统计法
系统工程理论与实践2000年10月
针对(2) 式的问题, 用二次规划模型求解事例特征权值需要具备数学规划领域的知识, 且求解过程比较繁琐Ζ下面我们提出一种信用统计法来确定事例特征权值, 该方法简单易懂, 其公式构造如下:
W
j
=
R 6
r i
m
r i W ij j =1, 2, …, n (4)
i =1
R =
W
j
6
n
m
i =1
表示第j 事例特征的权值, 并且有6W j =1Ζ
6
=
m
w j =
R
j =1
66
n
i =1m
r i w
ij
=
R
j =1i =1
66
n m
r i w
ij
=
R
i =1j =1
6r 6
i
i =1
n m
w
ij
j =1
R 6
m
r i =1
i =1
例2 由例(1) 中的数据, 代入(4) 式中, 可得W 1=0. 293, W 2=0. 473, W 3=0. 234Ζ
5 结束语
事例中各事例特征权值的正确确定, 在CBR 推理过程中起着重要的作用Λ例如在CBR 中的相似度计算、事例的检索等方面都需要用到事例特征的权值Λ而传统的事例特征的权值确定带有很大的主观性Λ为减少主观性, 增加额观性, 针对某一单个事例, 本文提出了D elph i 和A H P 相结合的权值确定法; 而针对事例库中的大量事例, 本文提出了二次规划模型权值确定法和信用统计权值确定法Λ这些方法提供了解决权值问题的一条途径Λ参考文献:
[1] Saaty T L . T he A nalytic H ierarchy P rocess :P lann ing , P ri o rity Setting [M ]. R esou rce A llocati on
M cGraw 2H ill , N ew Yo rk , 1980.
[2] M eade L M , L iles D H , Sark is J . Ju stifying Strategic A lliances and Partnering :a P rerequ isite fo r
~42. V irtual En terp rising [J ]. Om ega , In t J M gm t Sci , 1997, l 25(1) :29[3] L aw rence M Seifert , Joe Zhu . Iden tifying Excesses and D eficits in Ch inese Indu strial P roductivity
(1953-1990) :a W eigh ted D ata Envelopm en t A nalysis A pp roach [J ]. Om ega , In t . J . M gm t . Sci ,
1998, 26(2) :279~296. . (上接第83页)
[5] CasdagliM . N on linear p redicti on of chao tic ti ~356. m e series [J ]. Physica D , 1989, 35:335
[6] Gencay R . N on linear p redicti on of no isy ti . L ett A , m e series w ithfeedfo rw ard netw o rk s [J ]. Phys
1994, 187:397~403.
[7] Sm ith L A . Iden ticati on and p redicti on of low di ~m en si onal dynam ics [J ]. Physica D , 1992, 58:50
76.
[8] A lbano A M , Passam an te A , H ediger T , Farrell M E . U sing neu ral nets to look fo r chao s [J ].
~9. Physica D , 1992, 58:1
[9] Farm er J D . Chao tic attracto r of an infin ite 2di ~m en si on chao tic system [J ]. Physica D , 1982, 4:366
393.
[10] Sugihara G , M ay R M . N on linear fo recasting as a w ay of distingu ish ing chao s from m easu rem en t
~741. erro r in ti m e series [J ]. N atu re , 1990, 344:734
[11] A barbanel H D I , B row n R , Sido row ich J J , L Sh . T si m ring . T he analysis of ob served chao tic data
~1392. in physical system s [J ]. R ev M od Phys , 1993, 65:1331