第41卷第4期数学的头践与认识Vbl.41.No.42011年2月MATHEMATICSINPRACTICEANDTHEORYFeb..2011
基于航段需求计算网络竞价的近似动态规划方法
刘风,,一,吴祈宗・,王亚楠3,崔春生4
(1.北京理工大学管理与经济学院,北京100081)
(2.中央司法警官学院信息管理系,河北保定071000)
(3.河北科技大学经济管理学院,河北石家庄050018)
(4.中国电子信息产业发展研究院中国软件评测中心,北京100066)
摘要:竞价控制是收益管理中广泛应用的一种存量控制方法.将网络存量控制问
题描述为一个动态规划模型,通过状态向量的一个仿射函数近似动态规划的最优值
函数,并且在航段水平上考虑随机需求,最终得到一个计算网络竞价所需的确定性
线性规划(DLP),相对于标准的DLP,这个DLP得到了更接近于动态规划最优值
的上界.给出了一个列生成算法用于求解这个DLP,并提供了模拟算例,计算结果
表明可获得比标准的DLP方法更好的收益.
关键词:网络收益管理;动态规划;竞价控制
1引言
.收益管理中的网络存量控制问题可描述为一个动态规划模型,但由于状态空间的维度过于巨大,要得到这个模型的精确解基本上是不可能的,唯一实用的方法是尽量对决策问题近似化【11.在各种近似方法中,D’Sylvai2】和Glover等【3】提出的确定性线性规划(DLP)方法可能是最广为人知,也是最简单的一个例子.这种方法的主要不足在于它只考虑需求的期望值而忽略了需求预测中的所有不确定性.
由近似方法所得到的最有用的结果是对竞价的估计.Simpson[4】和Williamson[5】介绍了竞价控制的思想并提出把决策问题构建为各种数学规划,将其对偶价格作为竞价的近似值.以航空客运业为例,航空公司的资源是客运网络中各航节的存量,产品则是网络中各航线上特定价格等级的座位,同一航线,不同价格等级的座位属于不同的产品.竞价是每个航节(资源)的阈值.在资源允许的前提下,对于一个产品(某一航线上特定价格等级的座位)的预订请求,竞价控制意味着只有当产品的价格超过了它所使用的全部资源(航节)的竞价总和时,产品才会被出售,即接受预订.
网络收益管理中的大多数存量控制模型针对产品(特定航线与价格等级的组合)考虑不确定性需求.Higle[6】和BurakBiike等[7】研究了基于航段需求的随机规划(sP)模型.随着消费者选择购买不同航线或不同价格等级的机票可到达同一目的地的机会的增加,探索基于航段考虑随机需求的模型将会变得日益重要.出于此种考虑,这篇文章主要集中于建立一个基于航段需求计算网络竞价的易处理模型及求解算法,并通过模拟算例与标准的DLP方法收稿日期:2010-10—14资助项目:国家自然科学基金(609797010)
50数学的实践与认识41卷进行对比.
2问题描述
在这一节中将给出对决策问题的基本描述以及贯穿全文所使用的符号.
2.1马尔科夫决策过程描述
模型是一个时间离散且有界的马尔科夫决策过程.目标是使总的期望收益最大化.
首先,假设一个包含m个航节(资源)的航空客运网络,航节i∈I={1,2,…,m).整个网络有i个航段,航段n∈N={1,2,…,z}.航节的不同组合构成了网络中各航段上的航线,对于一个给定的航段礼可能有多条航线,r∈风={1,2,…,f心I)表示属于航段礼的航线,l凰f是集合R。的势.航空公司销售k种产品,铲品J∈J={1,2,…,忌).设山∈J是属于航线r的产品集合.・
定义关联矩阵A=【o‘,,】,其中,如果航线r使用航节i,ai,,=1,否则,8小=0.矩阵A的第r列,记为∥,表示航线r所使用航节的集合.
时间是离散的,t表示任意的_个时段,总共有T个时段.
需求定义在航段的水平上.每个时段t内,至多有一名顾客到达,顾客到达的概率为阮。,没有顾客到达的概率为1一∑P协..
nEN
网络的状态由剩余航节存量向量z=01,…,茁。)描述,初始状态由初始存量向量c=(c1,…,c。)表示.向量z满足
z∈托三∽,【{z∈.m:鼢∈{o,1,…,Q)Vi},当t=2,…,T
如果出售了航线r的一个座位,网络的状态变为z—A’,忽略顾客不到和退订的情况.给定当前的时段t和当前剩余航节存量向量z(t),当接到一个预订请求时,预订系统必卦“,须决定是否接受这个预订.
虽然需求是基于航段的,但必须针对产品(特定航线与价格等级)制定决策.设忌维向量.札表示这个决策,如果接受一个对航线t和价格等级J的座位.(产品)预订,Urj=1,否则,Urj=o.一般地,决策urJ是剩余存量向量z和机票价格,rJ的函数,即u,J=Urj(z,南),其中,J∈五Ⅶ,r∈%,n∈N.由于在任一时段内至多只有一个预订请求,并且不考虑不到和退订,因此决策向量u属于集合
.u(z)={u∈{0】1)七:∑∑肌,j≤z}‘hENrER。,j∈凡
如果系统接受了一个对航线r和价格等级J的座位预订,即urJ=l,将获得收益南>0,并且资源将按照矩阵A的第r列,∥,消耗.如果没有足够的资源可以满足预订,请求将被拒绝,当然也没有收益.即使有足够的资源,但如果将这些资源提供给潜在的未来顾客能够获得更多收益,当前的预订请求也可能被拒绝.
设V。(z)是在时段£的期初,状态为z,经过时期t,…,T所获得的最大的总期望收益,那么V。(z)必须满足贝尔曼方程.
嘶):111uEaXU{三Pt,n[,∈纛JrfrjUrj-_I-Vt-kl(一,∈磊^∥u巧)]+
4期刘风,等:基于航段需求计算网络竞价的近似动态规划方法51
(・一∑pt'。)阱・(z)MnEN
边界条件为卯+l(z)=0Vx.
当初始状态为c时,(1)式的值函数可通过下面的线性规划计算,
(DO)m,in、
”L。JVl(c),、
s.t.仇iz)≥∑P狮[∑加让,j+饥+,(z一∑∥u巧)]+hENr∈Rn,J∈山rER竹,j∈J,
(1一∑Pt,n)阱1(。)vt,z∈托,u∈u(z)
hEN
决策变量为饥(z)Ⅵ,。∈Xt.通过归纳法容易证明,(Do)的任意可行解砚(・)是方程(1)的最优值仇(・)的一个上界,相关证明参见文献[8】.
2.2(DLP)描述
由于状态空间的维度过大,一般情况下,(1)式和(DO)都很难精确求解.因此,在收益管理中,标准的方法是忽略时间的动态性,转而求解一个更简单的DLP.标准的DLP根据需求的期望值分配存量,这种方法假设每名顾客申请预订某一产品(特定航线和价格等级的座位),如果这个产品已经售完,顾客将离开系统.与之不同的是,这篇文章假设每名顾客申请预订某一特定航段(而不是特定航线和价格等级)的座位,当这个航段拥有多条航线时,即使某条航线的机票已经售完,顾客仍可能选择预订这个航段中其他航线的座位.设%表示在最后一个时段结束H寸'分配给航线r上价格等级为J的期望座位数,则(DLP)模型如下:
(DLP)ZDLP=m。ax∑∑如%
nEⅣrER。,J∈Jr(2)
(3)
(4)s,t.∑∑ai,,%≤ci,VihENrE如,j∈Jr0≤∑‰≤∑P抽,Vn一ZJ。J—Z√。'…
r∈R。,J∈Jrt、7
蚱j≥0,Vn,7.∈R。,J∈矗、
其中,需求是在航段的水平上加以考虑的.实际上,(DLP)是标准的DLP在航段需求下的一种扩展.(DLP)的对偶形式如下:
骝∑ciTri+∑(∑pt'n)pn
吼加
。+pn>一抽Vnr∈昆n∈‘∑州">一其中,7ri是约束(3)的对偶价格(即航节i的竞价),p。是约束(4)中右端不等式的对偶价格.设丌;和麻表示最优的对偶价格.在资源允许的前提下,假设有一个对航线r和价格等级J的座位预订请求,按照竞价控制的思想,如果
,rJ≥∑ai,,砖vn,r∈%,J∈Jr
iEJ
就接受预订,否则将拒绝此预订.
52数学的实践与认识41卷3函数近似
如前所述,(DO)含有大量的决策变量和约束条件,很难精确求解.使之得以简化的一种方式是通过一系列基本函数来近似仇(・).本节首先用一系列仿射函数来近似饥(・),并给出由此而得到的原规划和对偶规划.其次,建立对偶规划和(DLP)的联系.
3.1描述
考虑下面的仿射函数近似:
饥(。)≈仇+∑巩,‘甄
t
其中巩是常量补偿,丌t,‘是在时段t航节i的竞价,0T+1=0,7rT+l,t=o,Vt.
将(6)式代入(Do)得到
(D1)m日i。n61+∑7rl,{q
s.t.巩一‰・+∑h溉一,Tt+l,i(戤一∑Pt,n∑%r牡巧)]
≥∑仇,。
(D1)的对偶模型如下:∑局乱啊Ⅵ,z∈五,u∈U(z)
(P1)钠=峄∑(∑巩。∑^牡,j)孙,。
f龟,当江1
s.t’础‰蛳忍俨{纛_擘nEN≯rER∑,。,jE凡%胁¨州6)
∑,‰胪{蚝xtm∈U婶)
7≥0f1,if扛1LzEXt乩ueU(z)‘∑¨^。,Ⅵ-2'…,T(7)
约束(7)意味着
≥:m,掣=1,Ⅵ(8)
因此决策变量m忍。可解释为状态.行动概率,即"/t尚。表示在时段t,状态为z,做出决策U的概率.(6)式为流量平衡约束.
3.2与(DLP)的联系
为了由(P1)得到(DLP),定义
%=∑(pt’。urJ)Tt而。,VV∈取,J∈Jr(9)
由于9't。啪可解释为在时段t,状态为z,做出决策u的概率,(9)式右端的含义就是当最后一个时段结束时,提供给航线r上价格等级为J的期望座位数,这也正是(DLP)中决策变量%的含义.这样,(P1)的目标函数可写作:
∑(∑Pt,。∑九“,j)‰一=∑∑加‰
4期刘风,等:基于航段需求计算网络竞价的近似动态规划方法53
现在,固定i,将(6)式对t加总得到
∑xi"/t而u
£,z∈xt,u∈c,(z)
=ci+。∑(戤一∑仇-1'。‘hEN∑r∈Rn,J∈J-口印%)m-1'舭
(10)t=2,…,T,zEXt—l,t‘∈£,(。)上式化简后得到q=∑∑p抽∑
∑
"heNrERn,J∈Jrt=l,…,T一1,xEXt,u∈u(£)hENrERn,jEJr‘∑Xi'IT忍。(。妒札巧)弧州+zEXt,ueU(x)ErERn,J∈JrnEN由集合u的定义知瓢≥∑
此,(10)式意味着
Q≥ai,,乱,j忱,故xi≥∑Pt,nai,,让,jVi.因∑
t,ZEXt,“∈【,(z)
nEP咖∑(。时Urj)“/t而。tlr∈tk,J∈Jr=∑∑ai,rrERn,j∈凡∑t,zEXt,t‘∈u(。)(pt,。扎rj)‰,。=∑∑ai,r%,Vinr∈Rn,j∈Jr
从而得到了(3)式.另由(9)式可得
∑%=∑
r∈Rn,J∈Jr∑(pt,。urJ)‰,。
∑u,jTt,刚rERn,jeJrt,zEXt,t‘∈u(z)=∑仇,。∑
trERn,j∈.7●xEXt,t‘∈£,(o)
s∑P帅
t∑zEXt,u∈c,(¥)‰,。=∑P加,Vn‘
即产生了(4)式中右端的不等式.
上述讨论表明ZDLP≥Zpl.如前所述,(DO)的任意可行解瓴(・)是方程(1)的最优值仇(・)的一个上界,由于(P1)一(D1)给出Y(D0)的一个可行解,因此,Zpl≥Vl(C).下面的命题总结了这些结论.
命题1(P1)的任意可行解均是(DLP)的可行解,且有相同的目标函数值.因此,ZDLP≥ZpI≥Vl(c).
文献【9】证明了上界ZDLP是渐进最优的,即随着时间的流逝,需求不断实现,各航节的存量不断消耗,ZDLP逐渐收敛于u1(c),由命题1知Zpl也是渐进最优的.
4列生成算法
(P1)中虽然含有大量的变量,但约束条件相对较少,因此可以考虑用列生成算法对其求解.变量m^。使名P・减少的收益h,。,。的检验数)可表示为:
咄刚=∑p抽
n∑r∈R竹,j∈Jr(岛一∑口tIr丌t+1’t)u订一∑(7rtr7rt+l,i)翰一巩+‰・t‘
命题2吼禹。={::翼暑,z
2cI钆=0’Ⅵ,。,u是(P1)的一个可行解.证明对于所有的t和i,(6)式左端有∑zt‰。=q‰o=Qz∈xt,u∈U(¥).
数学的实践与认识41卷
并且对于所有的t>1,(6)式石端有
∑
xEXt一1,u∈u(茁)∑口{’,%)讯-l'叫=ct讯_11c,o=q(翰一∑p¨,。tERn,j∈山n
由命题2给定的(P1)的一个初始可行解可得(D1)的解为目,丌,下面解
船吼m胀ax帅,Wt,xu=们眠m艇ax吣,E。Pt,n懈E棚∈^(护≯m扎t)盱
∑(%一巩+1’i)觑也+0t+1
如果上式的最优函数值非正,那么(P1)就已经达到了最优,否则,将得到的列(上式的解)增加到(P1)中已经存在的列(解)中.对固定的t>1,这相当于求解下面的整数规划.
鼍警∑p伽
n∈N∑(如一∑。妒7rt+l’t)urj—E(%一叭埘)%一巩+吼+1(11)(12)
(13)s.t.∑E。寸u,j≤%VirER。,J∈J,u,j∈{o,1),Vn,r∈R。,J∈Jr
Xi∈{o,…,Q),Ⅵ
定义u;=’(14)’。z∈.Xt,t‘∈U(z)max.,眦而。Ⅵ是在t时段口,7r情况下印】减少的最大收益.‘‘
命题3设善是决策变量mm。的所有可能下标的一个子集,称仅含有下标属于集合∈的决策变量的(P1)为受限制的(P1),记为(P1(∈)).若(彳,(百,亓))分别为(P1(毒))及其对偶问题的解,耐是根据舀和亓计算u;得到的值,翟为(P1(专))的最优目标函数值,则有
T
Zpl≤翟+E
t=l0~9t.
证明考虑(P1)的任意可行解7,和任意数量的0t和?rt,iVt,i.对每一个t,i,(6)式两边乘以丌t,i并加上巩,然后把所得方程与
z(,y)=∑(∑P枷∑加札巧)‰,。
t,茁,tIhENrERn,J∈Jr
合并可得
z(,y)一∑丌1,iCx一日,=∑wt,x,uTt,叩≤∑u;‰,。=∑u;(∑‰,。)=∑u;
tt,¥,u.t,X,t‘tz,ut
其中,最后的等式是根据(8)式所得.对(P1)所有的可行解7,上式均成立,特别地,对于(P1)的一个最优解7木,其目标函数值为Zn木)=Zpl.进而,由受限问题(P1@"的强对偶性可得
∑亓¨q一百1=z(彳)=旅
iGl
T
因此,有ZPl≤誓+∑硪.
对于(PI),命题3给出了最优值Zp・与一个给定下标属于集合毒的可行解的目标函数值翟之间差的一个上界.若使翟比Zpl不超过Q,即,Zpl/Ze≤1+Q,须满足七-≤Q.此式可作为列生成算法的停机标准,完整的算法见图1.
4期刘风,等:基于航段需求计算网络竞价的近似动态规划方法55
列生成算法
令∈={(t,c,0)vt},解受限问题(P1(∈)),并对所有的t,令u;=oo
whileE沈>磁Qdo
t
对所有的t∈{1,…,T)
计算u;=maxwt禹u
正・U
选择一个(zt,ut)∈argITlaxtot^u
Z・U
更新∈一毒U{(t,耽,ut)).
解(P1(∈))
图l求解(P1)的列生成算法
5模拟算例
图2是一个假设的航空客运网络,这个网络包含5个航节,6个航段和10条航线.而且,每条航线有3个价格等级(商务,休闲一1和休闲一2).商务票价服从均值为200的泊松分布,休闲一1的票价服从均值为100的泊松分布,休闲一2的票价服从均值为50的泊松分布.需求是平稳的,简单起见,设每个时段没有顾客到达的概率为o.2.模拟T∈{20,50,100,200,400}5种情况.对每种情况,每个航节的初始存量均为c.算例尝试比较求解(P1)与(DLP)产生的上界以及各自执行竞价控制策略所得到的总期望收益.借助MATLAB,设Q=5%,求解(P1)一(D1)和(DLP),每个算例对(P1)一(D1)与(DLP)用相同的顾客需求序列分别执行竞价控制藻略,模拟100次,计算结果见表1.
图2—个具有5个航节、6个航段和10条航线的假设航空客运网络表1上界和总期望收益
56数学的实践与认识41卷6结束语
需求主要是根据以往的销售数据进行预测,而这些数据是基于产品(特定航线和价格等级)的.对于给定的一个航段,可能包含多条航线,在这种情况下,要分辨出顾客属于哪条航线或哪个价格等级并不是一件容易的事,这就增加了需求预测的难度.在这篇文章中,需求是基于网络中的航段而非产品.对此,可利用当前基于产品的需求预测技术,即对每个航段中相关航线和价格等级的需求进行加总以提高预测的准确性.
文章首先由动态规划入手,对动态规划的最优值函数做仿射函数近似,得到一个基于航段需求,用于计算网络竞价的DLP模型.相对于标准的DLP,这个DLP模型得到了更接近于动态规划最优值的上界.然后提供了一个列生成算法用于求解这个DLP,计算结果验证了上述结论并表明可获得比标准的DLP方法更好的收益.
参考文献
【1】TalluriKT,vanRyzinGJ.TheTheoryandPracticeofRevenueManagement[M].Boston:Kluwer
AcademicPublishers,2004:88-92.
[2】D’SylvaE.ODseatassignmenttomaximizeexpectedrevenue[R].Seattle:BoeingCommercial
AirplaneCompany,1982.
【3】GloverFR,GloverJ,LorenzoC.Mcmillan.Thepassenger-mixprobleminthescheduledairlines[J].
Interfaces.1982,12:7孓79.
[4】SIMPSONRW.UsingNetworkFlowTechniquestoFindShadowPricesforMarketandSeat
InventoryControl[M].Massachusetts:MITFlightTransportationLaboratoryMemorandum,M89-1,Cambridge,1989.
[5】WilliamsonEL.Airlinenetworkseatcontrol:methodologiesandrevenueimpacts[D].PhDthesis,
Massachusetts:MITFlightTransportationLaboratory,Cambridge,1992.
【6】HigleJL.Bid-pricecontrolwithorigin-destinationdemand:astochasticprogrammingapproach[J].
JournalofRevenueandPricingManagement,2007,5(4):291-304.
【7】BurakBiike,UtkuYildirimandHarunAhmetKuyumcu.Newstochasticlinearprogramming
approximationsfornetworkcapacitycontrolproblemwithbuy-ups[J].JournalofRevenueandPricingManagement,2008,7(1):61—84.
【剐AdelmanD.Dynamicbid—pricesinrevenuemanagement[J].OperRes,2007,55(4):647・661.
【9】CooperWL.Asymptoticbehaviorofanallocationpolicyforrevenuemanagement[J].Operations
Research,2002,50:720-727.
【10】TalluriKT,vallRyzinGJ.Ananalysisofbid—pricecontrolsfornetworkrevenuemanagement[J].
ManagementSci,1998,44(4):1577-1593.
【11】TalluriKT,vanRyzinGJ.Arandomizedlinearprogrammingmethodforcomputingbidprices[J].
TransportationSci,1999,33(2):207—216.
【12】WollmerRD.Anairlineseatmanagementmodelforasinglelegroutewhenlowerfareclassesbook
first[J】.Oper.Res,1992,40:26-37.
【13]ZhangD,AdelmanD.Anapproximatedynamicprogrammingapproachtonetworkrevenueman—
agementwithcustomerchoice[J].TransportationSci,2009,43(3):381—394.
4期刘风,等:基于航段需求计算网络竞价的近似动态规划方法57AnApproximateDynamicProgrammingApproachforComputingNetworkBidPriceswithFlightSegment
Demands
LIUFen91,一,WUQi—zon91,WANGYa-nan3,CUIChun-shen94
(1.SchoolofManagementandEconomics,BeijingInstituteofTechnology,Beijing100081,China)
(2.DepartmentofInformationManagement,theCentralInstituteforCorrectionalPolice,Baoding071000,
China)‘’
(3.CollegeofEconomicandManagement,HebeiUniversityofScienceandTechnology,Shijiazhuang050018,
China)
(4.ChinaCenterforInformationIndustryDevelopment,ChinaSoftwareTestingCenter,Beijing100066,China)
Abstract:Bid.pricecontrolisapopularmethodforcontrollingthesaleofinventoryinrevenuemanagement.Itiswellknownthatthenetworkcapacitycontrolproblemca4-1beformulatedasadynamicprogrammingmodel.Inthispaper,weapproximatetheoptimaldynamicprogrammingvaluefunctionwithanaffinefunctionofthestatevectoranddevelopourmodelbasedontheflightsegmentdemands.Weshowthattheresultingproblemisthedeterministiclinearprogramming(DLP)forcomputingnetworkbid-prices.TheDLP卵eldstighterboundsthantheclassicalDLP.、^,egiveacolumngenerationprocedureforsolvingtheDLPwithinadesiredoptimalitytolerance,andprovidesimulationexperiments.ThenumericalresultsshowthepolicyperformfromoursolutionapproachcaJloutperformthatfromtheclassicalDLP.
Keywords:networkrevenuemanagement;dynamicprogramming;bid-pricecontrols
基于航段需求计算网络竞价的近似动态规划方法
作者:
作者单位:刘风, 吴祈宗, 王亚楠, 崔春生, LIU Feng, WU Qi-zong, WANG Ya-nan, CUIChun-sheng刘风,LIU Feng(北京理工大学,管理与经济学院,北京,100081;中央司法警官学院信息管理系
,河北,保定,071000), 吴祈宗,WU Qi-zong(北京理工大学,管理与经济学院,北京,100081)
, 王亚楠,WANG Ya-nan(河北科技大学,经济管理学院,河北,石家庄,050018), 崔春生,CUI
Chun-sheng(中国电子信息产业发展研究院,中国软件评测中心,北京,100066)
数学的实践与认识
MATHEMATICS IN PRACTICE AND THEORY
2011,41(4)刊名:英文刊名:年,卷(期):
本文链接:http://d.g.wanfangdata.com.cn/Periodical_sxdsjyrs201104008.aspx
第41卷第4期数学的头践与认识Vbl.41.No.42011年2月MATHEMATICSINPRACTICEANDTHEORYFeb..2011
基于航段需求计算网络竞价的近似动态规划方法
刘风,,一,吴祈宗・,王亚楠3,崔春生4
(1.北京理工大学管理与经济学院,北京100081)
(2.中央司法警官学院信息管理系,河北保定071000)
(3.河北科技大学经济管理学院,河北石家庄050018)
(4.中国电子信息产业发展研究院中国软件评测中心,北京100066)
摘要:竞价控制是收益管理中广泛应用的一种存量控制方法.将网络存量控制问
题描述为一个动态规划模型,通过状态向量的一个仿射函数近似动态规划的最优值
函数,并且在航段水平上考虑随机需求,最终得到一个计算网络竞价所需的确定性
线性规划(DLP),相对于标准的DLP,这个DLP得到了更接近于动态规划最优值
的上界.给出了一个列生成算法用于求解这个DLP,并提供了模拟算例,计算结果
表明可获得比标准的DLP方法更好的收益.
关键词:网络收益管理;动态规划;竞价控制
1引言
.收益管理中的网络存量控制问题可描述为一个动态规划模型,但由于状态空间的维度过于巨大,要得到这个模型的精确解基本上是不可能的,唯一实用的方法是尽量对决策问题近似化【11.在各种近似方法中,D’Sylvai2】和Glover等【3】提出的确定性线性规划(DLP)方法可能是最广为人知,也是最简单的一个例子.这种方法的主要不足在于它只考虑需求的期望值而忽略了需求预测中的所有不确定性.
由近似方法所得到的最有用的结果是对竞价的估计.Simpson[4】和Williamson[5】介绍了竞价控制的思想并提出把决策问题构建为各种数学规划,将其对偶价格作为竞价的近似值.以航空客运业为例,航空公司的资源是客运网络中各航节的存量,产品则是网络中各航线上特定价格等级的座位,同一航线,不同价格等级的座位属于不同的产品.竞价是每个航节(资源)的阈值.在资源允许的前提下,对于一个产品(某一航线上特定价格等级的座位)的预订请求,竞价控制意味着只有当产品的价格超过了它所使用的全部资源(航节)的竞价总和时,产品才会被出售,即接受预订.
网络收益管理中的大多数存量控制模型针对产品(特定航线与价格等级的组合)考虑不确定性需求.Higle[6】和BurakBiike等[7】研究了基于航段需求的随机规划(sP)模型.随着消费者选择购买不同航线或不同价格等级的机票可到达同一目的地的机会的增加,探索基于航段考虑随机需求的模型将会变得日益重要.出于此种考虑,这篇文章主要集中于建立一个基于航段需求计算网络竞价的易处理模型及求解算法,并通过模拟算例与标准的DLP方法收稿日期:2010-10—14资助项目:国家自然科学基金(609797010)
50数学的实践与认识41卷进行对比.
2问题描述
在这一节中将给出对决策问题的基本描述以及贯穿全文所使用的符号.
2.1马尔科夫决策过程描述
模型是一个时间离散且有界的马尔科夫决策过程.目标是使总的期望收益最大化.
首先,假设一个包含m个航节(资源)的航空客运网络,航节i∈I={1,2,…,m).整个网络有i个航段,航段n∈N={1,2,…,z}.航节的不同组合构成了网络中各航段上的航线,对于一个给定的航段礼可能有多条航线,r∈风={1,2,…,f心I)表示属于航段礼的航线,l凰f是集合R。的势.航空公司销售k种产品,铲品J∈J={1,2,…,忌).设山∈J是属于航线r的产品集合.・
定义关联矩阵A=【o‘,,】,其中,如果航线r使用航节i,ai,,=1,否则,8小=0.矩阵A的第r列,记为∥,表示航线r所使用航节的集合.
时间是离散的,t表示任意的_个时段,总共有T个时段.
需求定义在航段的水平上.每个时段t内,至多有一名顾客到达,顾客到达的概率为阮。,没有顾客到达的概率为1一∑P协..
nEN
网络的状态由剩余航节存量向量z=01,…,茁。)描述,初始状态由初始存量向量c=(c1,…,c。)表示.向量z满足
z∈托三∽,【{z∈.m:鼢∈{o,1,…,Q)Vi},当t=2,…,T
如果出售了航线r的一个座位,网络的状态变为z—A’,忽略顾客不到和退订的情况.给定当前的时段t和当前剩余航节存量向量z(t),当接到一个预订请求时,预订系统必卦“,须决定是否接受这个预订.
虽然需求是基于航段的,但必须针对产品(特定航线与价格等级)制定决策.设忌维向量.札表示这个决策,如果接受一个对航线t和价格等级J的座位.(产品)预订,Urj=1,否则,Urj=o.一般地,决策urJ是剩余存量向量z和机票价格,rJ的函数,即u,J=Urj(z,南),其中,J∈五Ⅶ,r∈%,n∈N.由于在任一时段内至多只有一个预订请求,并且不考虑不到和退订,因此决策向量u属于集合
.u(z)={u∈{0】1)七:∑∑肌,j≤z}‘hENrER。,j∈凡
如果系统接受了一个对航线r和价格等级J的座位预订,即urJ=l,将获得收益南>0,并且资源将按照矩阵A的第r列,∥,消耗.如果没有足够的资源可以满足预订,请求将被拒绝,当然也没有收益.即使有足够的资源,但如果将这些资源提供给潜在的未来顾客能够获得更多收益,当前的预订请求也可能被拒绝.
设V。(z)是在时段£的期初,状态为z,经过时期t,…,T所获得的最大的总期望收益,那么V。(z)必须满足贝尔曼方程.
嘶):111uEaXU{三Pt,n[,∈纛JrfrjUrj-_I-Vt-kl(一,∈磊^∥u巧)]+
4期刘风,等:基于航段需求计算网络竞价的近似动态规划方法51
(・一∑pt'。)阱・(z)MnEN
边界条件为卯+l(z)=0Vx.
当初始状态为c时,(1)式的值函数可通过下面的线性规划计算,
(DO)m,in、
”L。JVl(c),、
s.t.仇iz)≥∑P狮[∑加让,j+饥+,(z一∑∥u巧)]+hENr∈Rn,J∈山rER竹,j∈J,
(1一∑Pt,n)阱1(。)vt,z∈托,u∈u(z)
hEN
决策变量为饥(z)Ⅵ,。∈Xt.通过归纳法容易证明,(Do)的任意可行解砚(・)是方程(1)的最优值仇(・)的一个上界,相关证明参见文献[8】.
2.2(DLP)描述
由于状态空间的维度过大,一般情况下,(1)式和(DO)都很难精确求解.因此,在收益管理中,标准的方法是忽略时间的动态性,转而求解一个更简单的DLP.标准的DLP根据需求的期望值分配存量,这种方法假设每名顾客申请预订某一产品(特定航线和价格等级的座位),如果这个产品已经售完,顾客将离开系统.与之不同的是,这篇文章假设每名顾客申请预订某一特定航段(而不是特定航线和价格等级)的座位,当这个航段拥有多条航线时,即使某条航线的机票已经售完,顾客仍可能选择预订这个航段中其他航线的座位.设%表示在最后一个时段结束H寸'分配给航线r上价格等级为J的期望座位数,则(DLP)模型如下:
(DLP)ZDLP=m。ax∑∑如%
nEⅣrER。,J∈Jr(2)
(3)
(4)s,t.∑∑ai,,%≤ci,VihENrE如,j∈Jr0≤∑‰≤∑P抽,Vn一ZJ。J—Z√。'…
r∈R。,J∈Jrt、7
蚱j≥0,Vn,7.∈R。,J∈矗、
其中,需求是在航段的水平上加以考虑的.实际上,(DLP)是标准的DLP在航段需求下的一种扩展.(DLP)的对偶形式如下:
骝∑ciTri+∑(∑pt'n)pn
吼加
。+pn>一抽Vnr∈昆n∈‘∑州">一其中,7ri是约束(3)的对偶价格(即航节i的竞价),p。是约束(4)中右端不等式的对偶价格.设丌;和麻表示最优的对偶价格.在资源允许的前提下,假设有一个对航线r和价格等级J的座位预订请求,按照竞价控制的思想,如果
,rJ≥∑ai,,砖vn,r∈%,J∈Jr
iEJ
就接受预订,否则将拒绝此预订.
52数学的实践与认识41卷3函数近似
如前所述,(DO)含有大量的决策变量和约束条件,很难精确求解.使之得以简化的一种方式是通过一系列基本函数来近似仇(・).本节首先用一系列仿射函数来近似饥(・),并给出由此而得到的原规划和对偶规划.其次,建立对偶规划和(DLP)的联系.
3.1描述
考虑下面的仿射函数近似:
饥(。)≈仇+∑巩,‘甄
t
其中巩是常量补偿,丌t,‘是在时段t航节i的竞价,0T+1=0,7rT+l,t=o,Vt.
将(6)式代入(Do)得到
(D1)m日i。n61+∑7rl,{q
s.t.巩一‰・+∑h溉一,Tt+l,i(戤一∑Pt,n∑%r牡巧)]
≥∑仇,。
(D1)的对偶模型如下:∑局乱啊Ⅵ,z∈五,u∈U(z)
(P1)钠=峄∑(∑巩。∑^牡,j)孙,。
f龟,当江1
s.t’础‰蛳忍俨{纛_擘nEN≯rER∑,。,jE凡%胁¨州6)
∑,‰胪{蚝xtm∈U婶)
7≥0f1,if扛1LzEXt乩ueU(z)‘∑¨^。,Ⅵ-2'…,T(7)
约束(7)意味着
≥:m,掣=1,Ⅵ(8)
因此决策变量m忍。可解释为状态.行动概率,即"/t尚。表示在时段t,状态为z,做出决策U的概率.(6)式为流量平衡约束.
3.2与(DLP)的联系
为了由(P1)得到(DLP),定义
%=∑(pt’。urJ)Tt而。,VV∈取,J∈Jr(9)
由于9't。啪可解释为在时段t,状态为z,做出决策u的概率,(9)式右端的含义就是当最后一个时段结束时,提供给航线r上价格等级为J的期望座位数,这也正是(DLP)中决策变量%的含义.这样,(P1)的目标函数可写作:
∑(∑Pt,。∑九“,j)‰一=∑∑加‰
4期刘风,等:基于航段需求计算网络竞价的近似动态规划方法53
现在,固定i,将(6)式对t加总得到
∑xi"/t而u
£,z∈xt,u∈c,(z)
=ci+。∑(戤一∑仇-1'。‘hEN∑r∈Rn,J∈J-口印%)m-1'舭
(10)t=2,…,T,zEXt—l,t‘∈£,(。)上式化简后得到q=∑∑p抽∑
∑
"heNrERn,J∈Jrt=l,…,T一1,xEXt,u∈u(£)hENrERn,jEJr‘∑Xi'IT忍。(。妒札巧)弧州+zEXt,ueU(x)ErERn,J∈JrnEN由集合u的定义知瓢≥∑
此,(10)式意味着
Q≥ai,,乱,j忱,故xi≥∑Pt,nai,,让,jVi.因∑
t,ZEXt,“∈【,(z)
nEP咖∑(。时Urj)“/t而。tlr∈tk,J∈Jr=∑∑ai,rrERn,j∈凡∑t,zEXt,t‘∈u(。)(pt,。扎rj)‰,。=∑∑ai,r%,Vinr∈Rn,j∈Jr
从而得到了(3)式.另由(9)式可得
∑%=∑
r∈Rn,J∈Jr∑(pt,。urJ)‰,。
∑u,jTt,刚rERn,jeJrt,zEXt,t‘∈u(z)=∑仇,。∑
trERn,j∈.7●xEXt,t‘∈£,(o)
s∑P帅
t∑zEXt,u∈c,(¥)‰,。=∑P加,Vn‘
即产生了(4)式中右端的不等式.
上述讨论表明ZDLP≥Zpl.如前所述,(DO)的任意可行解瓴(・)是方程(1)的最优值仇(・)的一个上界,由于(P1)一(D1)给出Y(D0)的一个可行解,因此,Zpl≥Vl(C).下面的命题总结了这些结论.
命题1(P1)的任意可行解均是(DLP)的可行解,且有相同的目标函数值.因此,ZDLP≥ZpI≥Vl(c).
文献【9】证明了上界ZDLP是渐进最优的,即随着时间的流逝,需求不断实现,各航节的存量不断消耗,ZDLP逐渐收敛于u1(c),由命题1知Zpl也是渐进最优的.
4列生成算法
(P1)中虽然含有大量的变量,但约束条件相对较少,因此可以考虑用列生成算法对其求解.变量m^。使名P・减少的收益h,。,。的检验数)可表示为:
咄刚=∑p抽
n∑r∈R竹,j∈Jr(岛一∑口tIr丌t+1’t)u订一∑(7rtr7rt+l,i)翰一巩+‰・t‘
命题2吼禹。={::翼暑,z
2cI钆=0’Ⅵ,。,u是(P1)的一个可行解.证明对于所有的t和i,(6)式左端有∑zt‰。=q‰o=Qz∈xt,u∈U(¥).
数学的实践与认识41卷
并且对于所有的t>1,(6)式石端有
∑
xEXt一1,u∈u(茁)∑口{’,%)讯-l'叫=ct讯_11c,o=q(翰一∑p¨,。tERn,j∈山n
由命题2给定的(P1)的一个初始可行解可得(D1)的解为目,丌,下面解
船吼m胀ax帅,Wt,xu=们眠m艇ax吣,E。Pt,n懈E棚∈^(护≯m扎t)盱
∑(%一巩+1’i)觑也+0t+1
如果上式的最优函数值非正,那么(P1)就已经达到了最优,否则,将得到的列(上式的解)增加到(P1)中已经存在的列(解)中.对固定的t>1,这相当于求解下面的整数规划.
鼍警∑p伽
n∈N∑(如一∑。妒7rt+l’t)urj—E(%一叭埘)%一巩+吼+1(11)(12)
(13)s.t.∑E。寸u,j≤%VirER。,J∈J,u,j∈{o,1),Vn,r∈R。,J∈Jr
Xi∈{o,…,Q),Ⅵ
定义u;=’(14)’。z∈.Xt,t‘∈U(z)max.,眦而。Ⅵ是在t时段口,7r情况下印】减少的最大收益.‘‘
命题3设善是决策变量mm。的所有可能下标的一个子集,称仅含有下标属于集合∈的决策变量的(P1)为受限制的(P1),记为(P1(∈)).若(彳,(百,亓))分别为(P1(毒))及其对偶问题的解,耐是根据舀和亓计算u;得到的值,翟为(P1(专))的最优目标函数值,则有
T
Zpl≤翟+E
t=l0~9t.
证明考虑(P1)的任意可行解7,和任意数量的0t和?rt,iVt,i.对每一个t,i,(6)式两边乘以丌t,i并加上巩,然后把所得方程与
z(,y)=∑(∑P枷∑加札巧)‰,。
t,茁,tIhENrERn,J∈Jr
合并可得
z(,y)一∑丌1,iCx一日,=∑wt,x,uTt,叩≤∑u;‰,。=∑u;(∑‰,。)=∑u;
tt,¥,u.t,X,t‘tz,ut
其中,最后的等式是根据(8)式所得.对(P1)所有的可行解7,上式均成立,特别地,对于(P1)的一个最优解7木,其目标函数值为Zn木)=Zpl.进而,由受限问题(P1@"的强对偶性可得
∑亓¨q一百1=z(彳)=旅
iGl
T
因此,有ZPl≤誓+∑硪.
对于(PI),命题3给出了最优值Zp・与一个给定下标属于集合毒的可行解的目标函数值翟之间差的一个上界.若使翟比Zpl不超过Q,即,Zpl/Ze≤1+Q,须满足七-≤Q.此式可作为列生成算法的停机标准,完整的算法见图1.
4期刘风,等:基于航段需求计算网络竞价的近似动态规划方法55
列生成算法
令∈={(t,c,0)vt},解受限问题(P1(∈)),并对所有的t,令u;=oo
whileE沈>磁Qdo
t
对所有的t∈{1,…,T)
计算u;=maxwt禹u
正・U
选择一个(zt,ut)∈argITlaxtot^u
Z・U
更新∈一毒U{(t,耽,ut)).
解(P1(∈))
图l求解(P1)的列生成算法
5模拟算例
图2是一个假设的航空客运网络,这个网络包含5个航节,6个航段和10条航线.而且,每条航线有3个价格等级(商务,休闲一1和休闲一2).商务票价服从均值为200的泊松分布,休闲一1的票价服从均值为100的泊松分布,休闲一2的票价服从均值为50的泊松分布.需求是平稳的,简单起见,设每个时段没有顾客到达的概率为o.2.模拟T∈{20,50,100,200,400}5种情况.对每种情况,每个航节的初始存量均为c.算例尝试比较求解(P1)与(DLP)产生的上界以及各自执行竞价控制策略所得到的总期望收益.借助MATLAB,设Q=5%,求解(P1)一(D1)和(DLP),每个算例对(P1)一(D1)与(DLP)用相同的顾客需求序列分别执行竞价控制藻略,模拟100次,计算结果见表1.
图2—个具有5个航节、6个航段和10条航线的假设航空客运网络表1上界和总期望收益
56数学的实践与认识41卷6结束语
需求主要是根据以往的销售数据进行预测,而这些数据是基于产品(特定航线和价格等级)的.对于给定的一个航段,可能包含多条航线,在这种情况下,要分辨出顾客属于哪条航线或哪个价格等级并不是一件容易的事,这就增加了需求预测的难度.在这篇文章中,需求是基于网络中的航段而非产品.对此,可利用当前基于产品的需求预测技术,即对每个航段中相关航线和价格等级的需求进行加总以提高预测的准确性.
文章首先由动态规划入手,对动态规划的最优值函数做仿射函数近似,得到一个基于航段需求,用于计算网络竞价的DLP模型.相对于标准的DLP,这个DLP模型得到了更接近于动态规划最优值的上界.然后提供了一个列生成算法用于求解这个DLP,计算结果验证了上述结论并表明可获得比标准的DLP方法更好的收益.
参考文献
【1】TalluriKT,vanRyzinGJ.TheTheoryandPracticeofRevenueManagement[M].Boston:Kluwer
AcademicPublishers,2004:88-92.
[2】D’SylvaE.ODseatassignmenttomaximizeexpectedrevenue[R].Seattle:BoeingCommercial
AirplaneCompany,1982.
【3】GloverFR,GloverJ,LorenzoC.Mcmillan.Thepassenger-mixprobleminthescheduledairlines[J].
Interfaces.1982,12:7孓79.
[4】SIMPSONRW.UsingNetworkFlowTechniquestoFindShadowPricesforMarketandSeat
InventoryControl[M].Massachusetts:MITFlightTransportationLaboratoryMemorandum,M89-1,Cambridge,1989.
[5】WilliamsonEL.Airlinenetworkseatcontrol:methodologiesandrevenueimpacts[D].PhDthesis,
Massachusetts:MITFlightTransportationLaboratory,Cambridge,1992.
【6】HigleJL.Bid-pricecontrolwithorigin-destinationdemand:astochasticprogrammingapproach[J].
JournalofRevenueandPricingManagement,2007,5(4):291-304.
【7】BurakBiike,UtkuYildirimandHarunAhmetKuyumcu.Newstochasticlinearprogramming
approximationsfornetworkcapacitycontrolproblemwithbuy-ups[J].JournalofRevenueandPricingManagement,2008,7(1):61—84.
【剐AdelmanD.Dynamicbid—pricesinrevenuemanagement[J].OperRes,2007,55(4):647・661.
【9】CooperWL.Asymptoticbehaviorofanallocationpolicyforrevenuemanagement[J].Operations
Research,2002,50:720-727.
【10】TalluriKT,vallRyzinGJ.Ananalysisofbid—pricecontrolsfornetworkrevenuemanagement[J].
ManagementSci,1998,44(4):1577-1593.
【11】TalluriKT,vanRyzinGJ.Arandomizedlinearprogrammingmethodforcomputingbidprices[J].
TransportationSci,1999,33(2):207—216.
【12】WollmerRD.Anairlineseatmanagementmodelforasinglelegroutewhenlowerfareclassesbook
first[J】.Oper.Res,1992,40:26-37.
【13]ZhangD,AdelmanD.Anapproximatedynamicprogrammingapproachtonetworkrevenueman—
agementwithcustomerchoice[J].TransportationSci,2009,43(3):381—394.
4期刘风,等:基于航段需求计算网络竞价的近似动态规划方法57AnApproximateDynamicProgrammingApproachforComputingNetworkBidPriceswithFlightSegment
Demands
LIUFen91,一,WUQi—zon91,WANGYa-nan3,CUIChun-shen94
(1.SchoolofManagementandEconomics,BeijingInstituteofTechnology,Beijing100081,China)
(2.DepartmentofInformationManagement,theCentralInstituteforCorrectionalPolice,Baoding071000,
China)‘’
(3.CollegeofEconomicandManagement,HebeiUniversityofScienceandTechnology,Shijiazhuang050018,
China)
(4.ChinaCenterforInformationIndustryDevelopment,ChinaSoftwareTestingCenter,Beijing100066,China)
Abstract:Bid.pricecontrolisapopularmethodforcontrollingthesaleofinventoryinrevenuemanagement.Itiswellknownthatthenetworkcapacitycontrolproblemca4-1beformulatedasadynamicprogrammingmodel.Inthispaper,weapproximatetheoptimaldynamicprogrammingvaluefunctionwithanaffinefunctionofthestatevectoranddevelopourmodelbasedontheflightsegmentdemands.Weshowthattheresultingproblemisthedeterministiclinearprogramming(DLP)forcomputingnetworkbid-prices.TheDLP卵eldstighterboundsthantheclassicalDLP.、^,egiveacolumngenerationprocedureforsolvingtheDLPwithinadesiredoptimalitytolerance,andprovidesimulationexperiments.ThenumericalresultsshowthepolicyperformfromoursolutionapproachcaJloutperformthatfromtheclassicalDLP.
Keywords:networkrevenuemanagement;dynamicprogramming;bid-pricecontrols
基于航段需求计算网络竞价的近似动态规划方法
作者:
作者单位:刘风, 吴祈宗, 王亚楠, 崔春生, LIU Feng, WU Qi-zong, WANG Ya-nan, CUIChun-sheng刘风,LIU Feng(北京理工大学,管理与经济学院,北京,100081;中央司法警官学院信息管理系
,河北,保定,071000), 吴祈宗,WU Qi-zong(北京理工大学,管理与经济学院,北京,100081)
, 王亚楠,WANG Ya-nan(河北科技大学,经济管理学院,河北,石家庄,050018), 崔春生,CUI
Chun-sheng(中国电子信息产业发展研究院,中国软件评测中心,北京,100066)
数学的实践与认识
MATHEMATICS IN PRACTICE AND THEORY
2011,41(4)刊名:英文刊名:年,卷(期):
本文链接:http://d.g.wanfangdata.com.cn/Periodical_sxdsjyrs201104008.aspx