第24卷 第04期
计 算 机 仿 真
2007年04月
文章编号:1006-9348(2007)04-0057-04
传染病传播模型研究
余雷,薛惠锋,李刚
(西北工业大学资源与环境信息化工程研究所,陕西西安710072)
摘要:用数学模型帮助发现传染病的传播机理,预测传染病的流行趋势已成为共识。主要简述了传染病模型的发展历程。传染病的数学模型研究分为两类:决定性模型和网络动力学模型。虽然决定论模型目前仍然具有非常重要的学术地位,但随着人工智能计算机技术的发展,目前网络动力学模型成为了新的研究热点。决定性模型主要介绍了SIS和SIR模型,网络动力学模型主要介绍了目前流行病数学模型中研究较多、应用较广的模型,包括元胞自动机、人工神经网络、无尺度网络模型。介绍了各种模型的研究方法,并且探讨了今后的研究热点,以利用其模拟结果可以更好地为传染病防治决策提供支持。关键词:传染病模型;元胞自动机;人工神经网络;无尺度网络中图分类号:N941;TP273
文献标识码:A
ResearchofEpidemicSpreadModel
YULei,XUEHui-feng,LIGang
(ResourceandEntertainmentInstitute,NorthwesternPoiytechnicaiUniversity,Contactaddress:
N0.26,NorthwesternPoiytechnicaiUniversity,Xi’an,Shanxi,710072,China)
ABSTRACT:Nowmathematicaimodeihasbecomeimportantmethodoiogyinforcastingtheepidemictrend.Thispaperintroducesbriefiythemodeiofepidemic.Inthispaper,themathematicsmodeioftheinfectiousdiseaseisdividedintotwokinds:Decisivemodeiandnetworkdynamicsmodei.Aithoughdecisivemodeistiiihastheextremeiyimportantacademicstatusatpresent,networkdynamicsmodeihasbecomethenewresearchhotspotatpresentaiongwiththeartificiaiinteiiigencecomputertechnoiogydeveiopment.WemainiyintroducesdecisivemodeiinciudingSISandSIRmodei.Thenetworkdynamicsmodeihasbeenrecommendedstudyingmoreandusingwidermodeiinthemathematicsmodeiofepidemicdiseaseatpresent,inciudingCeiiuiarAutomatamodei,artificiaineurainetworkmodei,scaiefreenetworkmodei.Thispaperintroducestheresearchapproachesofvariouskindsofmodeis,andprobesintotheresearchfocusinthefuture.Usingthesimuiationresuitscanprovidethesupportofdecision-makinginepidemicpreventingandcontroi.
KEYWORDS:Epidemicmodei;CeiiuiarAutomata;artificiaineurainetwork;scaiefreenetwork
中,人们不断地吸收最新数学和物理成果,使统计方法不断
1 引言
人类历史上曾多次受到危害极其严重的传染病的威胁,
得到改进,因此这种曾在历史上起过很大作用的方法直到今天仍然是重要的研究手段。目前,对传染病的研究有4种方法:描述性研究,分析性研究,实验性研究和理论性研究。在理论性研究中,数学模型起着极其重要的作用。它把传染病的主要特征通过假设、参数、变量和它们之间的联系清晰地揭示出来。数学模型的分析结果能提供许多强有力的理论基础和概念。用数学模型帮助发现传染病的传播机理,预测传染病的流行趋势已成为共识。纵观传染病的数学模型研究,我们可把它们分为两类:决定性模型和网络动力学模型。
目前决定论模型仍然具有非常重要的学术地位,但是随着人工智能计算机技术的发展,网络动力学模型成为了新的研究热点。本文主要就这两类模型介绍其研究方法,并且探
特别是在2002年冬到2003年春天,非典型肺炎(SARS)传染病突然侵袭了大半个中国,给国民经济和人民的正常活动都造成了很大的影响,由于人们对此种传染病的传播机理还不太清楚,因而一度引起了人们心理上的恐慌。因此,预防和控制传染病的研究就显得极其重要。
其实对传染病的描述和预测是人们由来已久的话题,最早使用的完全是总结经验型的统计方法。在漫长的研究过程
收稿日期:2006-05-25 修回日期:2006-06-08
—57—
讨了今后的研究热点。决定性模型主要介绍了SIS和SIR模型,网络动力学模型主要介绍了目前流行病数学模型中研究较多、应用较广的模型,包括元胞自动机、人工神经网络、无尺度网络模型。
如考虑时滞因素、年龄结构、隔离影响、变动人口等;模型维数上的增高;结合某些具体的传染病进行更为深入的研
[5,6,7,8,9]
究。
总体来说这些模型往往能给出与实际统计结果符合得相当不错的结果,说明它们抓住了流行病传播的一些基本动力学法则。然而,这种方法是决定论的,那就是认为如果模型方程中所有的参数和所有变量的初值都能精确知道,任何时刻的流行病演化情况就一定完全确定并可以无比精确地预言。这明显地与事实不符,流行病的传播过程中显然充满了偶然因素的影响。随着人工智能计算机技术的发展,目前网络动力学模型成为了新的研究热点。
2 决定性模型
虽然从1840年以来就有人试探运用简单的数学模型来
建立流行病传播的模型并进行预测,然而直到二十世纪的四五十年代,以微分方程为主的决定论模型才开始受到重视。决定论模型迄今为止仍然具有非常重要的学术地位。其中最有影响的是所谓SIR和SIS模型。
SIR模型是Kermack[1,2,3]
等人在1927年提出的一个传
染病的模型,这个模型得到了历史上发生过的大规模的传染病(如上世纪初在印度孟买发生的瘟疫)数据的有力支持,后来很多研究人员对SIR模型做了推广。
首先假定某地区的人群数是一个常数,把他们分为三个部分:易感人群、被感染者、恢复者。易感人群很容易被感染而还没有被感染(susceptibie),用S(t)表示;被感染者是已经被感染而且又将感染他人(infected),用(It)表示;恢复者是他们从流行病中获得免疫并恢复为正常人(susceptibie),用R(t)表示。也有一些流行病在治愈后并不能免疫,可能立即再次感染,肺结核和淋病常用作这样的例子。这时人群也可分为三组:未患病但可被感染(susceptibie)、病人且可传染别人(infected)、治愈但仍可感染(susceptibie),这就是SIS模型。
在SIR模型中分别用(st)、(It)、R(t)表示这三类人在t时刻的人口数,设病人的日接触率为!,日治愈率为",传染期接触数为#="/!,1/#称为相对移出率。设初始时刻的健康者和病人的比例分别是S0和 0,故SIR模型的方程为:
d dt
=!S -"
dS
dt=-!S dR
dt="
其中初值S(0)=S0,( 0)= 0,R(0)=R0
根据以上公式可以得出当易感染人数下降到S=1/#时,得病人数( t)达到最大值,而后得病人数逐渐减少,最终趋向于零。因此可以得知,如果在发病初期易感染的人数S0S1/#,
那么传染病就很快会被消灭。如果在发病初期易感染的人数S0>1/#,那么得病人数先增加,当其达到最大值时,然后逐渐减少直至消灭。
早期的传染病模型大多假设种群总数为常数或者渐近常数,这在时间较短、环境封闭等特定条件下是合理的,但在实际问题中,研究总人口具有种群动力学的流行病模型。这
类模型已被AndersonandMay[4]
在实验室所验证。近期所研
究的模型大致有三个发展方向:模型所涉及的因素增多,例
—58—
3 网络动力学模型
网络动力学被认为是非线性科学研究的一种,它主要包
括元胞自动机、布尔网络、神经网络以及L-系统等。网络动力学的基本结构可以采用数学中的图来描述,而构成网络的结点的状态转移也遵循相同的局部规则,网络动力学模型都具有结构与规则固定的特征。比较典型的网络动力学模型有:元胞自动机、人工神经网络、L-系统、随机布尔网络、无尺度网络等模型,其中元胞自动机、人工神经网络和无标度网络是目前流行病数学模型中研究较多、应用较广的模型。3.1
元胞自动机模型
元胞自动机(CeiiuiarAutomata,简称CA),也译为细胞自动机、点格自动机、分子自动机或单元自动机,它是时间和
空间都离散的动力模型[10]
。20世纪40年代初,现代计算机的
创始人之一冯・诺依曼开始思考描述生物自我繁衍的逻辑形式,提出了元胞自动机的概念。尽管是一个伟大的设想,但受制于当时计算机能力的限制,直到20世纪80年代,S.
Woifram[11]才对元胞自动机进行了全面的研究。
按照元胞自动机的定义,用数学符号来表示,元胞自动机可以视为由一个元胞空间和定义于该空间的变换函数所组成。元胞自动机用形式语言的方式来描述,可以用一个四元组表示:
A=(Ld,S,N,f)
在这里A代表一个元胞自动机系统,Ld代表一个规则划分的网格空间,每个网格单元(cell)就是一个元胞;L通常为一维或二维空间,但理论上可以是一个任意正整数维的规则空间。S代表一个离散的有限集合,用来表示各个元胞的状态;N代表元胞的邻居集合,对于任何元胞的邻居集合NCL,设邻居集合内元素数目为小I,那么,N可以表示为一个所有邻域内元胞的组合(包括中心元胞),即包含I个不同元胞状态的一个空间矢量,记为:
N=(S1,S2,S3,…SI),SiEZ(整数集合),iE(1,…I)
f表示一个映射函数:SIt_St+1,即根据t时刻某个元胞的所有邻居的状态组合来确定t+1时刻该元胞的状态值。f通常又被称为状态转换函数,或局部规则。
目前元胞自动机已经成为复杂性研究中网络动力学的典型代表,它的提出为许多复杂系统的研究提供了有力的工具。因此,用元胞自动机描述传染病传播的方法逐渐受到了重视,尤其在20世纪90年代中期以后出现了大量研究论
[12,13,14,15,17,18]文。
功能函数的确定:BP神经网络的功能函数要求处处可微分且收敛。目前的研究多用Sigmoid函数f(/1+1x)=1(
x-x
e-x),极少使用双曲正切函数厂f((/ex+2x)=(e-e)
e-x)作为网络功能函数。
用人工神经网络建立传染病数学模型具有以下优点:1)通过学习可以逼近任意非线性映射,不受非线性模型的限制。
2)高度的并行分布式处理能力,分布式处理能力体现在网络的各个连接权系数上。
3)具有联想记忆、自组织、自学习能力,能根据环境的变化自动调整自己的能力(反映在连接权系数上),不需人工干目前国内用元胞自动机建立传染病数学模型的还不多,
[19]
等人根据国外的文献,将SARS传染数据通许田、张培培
过SIR模型和元胞自动机模型对比,认为决定论模型拟合得到的完全光滑曲线对应原胞自动机模型在无限大空间中或有限空间中无限多次重复取平均的结果。3.2
人工神经网络模型
人工神经网络模型是以生物体的神经系统工作原理为基础而建立的一种网络模型。网络中的基本单元是类似于生物神经元的人工神经元,也是一种广义的自动机;由许许多多类似的人工神经元经一定方式连接起来形成的网络,表现出系统的整体性行为。
近年来人工神经网络(ANN)在传染病分析与预测中的应用也越来越广泛。人工神经网络具有自组织、自适应及自学习功能。其中误差反向传播网络BP网络是一种非线性映射人工神经网络。RobertHechtNieison证明了对于任意闭合区间连续函数都可以用含有一个隐层的BP网络来逼近。当网络训练好之后,就可以用来预测传染病的流行趋势。一些研究表明,应用BP网络具有较高的预测精度
[20,21,22]
。
BP神经网络模型是人工神经网络中应用最广泛的一种。它的功能函数为S型函数,神经元连接形式为前馈神经网络,学习方式为有监督学习。
BP学习算法实质上是最小均方(LMS)算法的推广,是一种非线性梯度优化算法,因此不可避免地存在局部极小值问题。学习算法的收敛速度很慢,通常需要上千次迭代或更多。
利用神经网络来建立传染病发病率预测模型时需要确定神经网络BP训练中的模型参数。模型参数包括模型层数、隐含层节点数和功能函数。
模型层数的确定尚无统一方法。白艳萍,靳祯
[21]
采用了6个神经元的两层前向神经网络来预测与分析SARS传染病的流行趋势,输入层为一个神经元,隐含层为四个神经元,输出层为一个神经元。但目前多数人认为2个隐含层的ANN与1个隐含层的ANN进行比较,前者易陷入局部极小,误差在局部极小处振荡,在同样学习次数的训练中,二者所达到的
误差相近,因而选用3层BP神经网络模型[22]
。
节点数包括输入输出层节点数和隐含层节点数,输入节点一般为输入变量的个数,输出层节点为传染病每天发病数。隐含层节点数目的确定难度较大,若隐含层节点太少,网络可能不能训练;若网络节点数太多,网络训练可能无穷无尽,不易收敛。在选取隐含层节点数时,根据最小上界(ieastupperbound,LUB)理论,在大多数文献中取隐含层节点数为4-6。
预。
但是BP神经网络也具有收敛速度慢、可能收敛到局部极值等缺弱点。3.3
无标度网络模型
传统的随机网络(如ER模型),尽管连接是随机设置的,但大部分节点的连接数目会大致相同,即节点的分布方式遵循钟形的泊松分布,有一个特征性的“平均数”。连接数目比平均数高许多或低许多的节点都极少,随着连接数的增大,其概率呈指数式迅速递减.故随机网络亦称指数网络。
1999年,A-L.Barabasi和R.Aibert等提出了一个“无标度网络”模型,由此揭开了复杂网络研究的新篇章。A-L.Barabasi等人开展一项描绘万维网的研究。他们原本以为会发现一个随机网络的钟形分布图,但结果他们却意外发现,万维网基本上是由少数高连通性的页面串连起来的,80%以上的页面连接数不到4个,而占节点总数不到万分之一的极少节点,却和1000个以上的节点连接。随机网络具有的大多数节点连接数相同的性质不见了。他们把这种网络称为“无
标度网络(Scaie-FreeNetworks)”[22]。
无标度网络具有稳健性和脆弱性双重特性,都源于其存在集散节点。SARS的传播,也使我们看到无标度网络的稳健
性和脆弱性所具有的现实的重要性[23]
。
2001年P-Satorras等人研究了一个由BA模型产生的无限大无标度网上的SIS传播模型,
证明了规律!~exp(-C/")(C为常数),这里!定义为“传播达到稳定时曾患病人所占比例”,称为“流行度”。这个规律说明对于再小的有效传播率",流行度也不为零。这说明无标度网抵抗流行病的
能力很弱,可以在任意小的有效传播率之下维持传播[24]。在
前面介绍决定性模型中可以看出,根据数学模型应该存在着一个不为零的有效传播率阈值"c,只有超过阈值时流行度才不为零,这与无标度网络得出的结论是不一样的。
目前无标度网络研究传染病的文章还处于起步阶段,但正在逐步成为一个新的热点。
4 结论
本文主要简述了流行病模型的发展历程。传染疾病的传
播过程中充满了偶然因素的影响,它的传播显然是一种复杂
—59—
现象,需要纳入新兴的复杂性科学的研究之中。但是也有其固有缺点,对于复杂现象只能作趋势的预测,而做不到精确的预测。而决定性模型在应用中往往能给出与实际统计结果符合得相当不错的结果,所以目前仍然具有非常重要的学术地位。
流行病模型长期以来都是研究的热点之一,文献的数量庞大,但在国内目前从复杂系统的角度来进行研究的还不是很多,所以下一步的主要工作就是复杂系统的角度来进行。我们可以用网络动力学模型建立能够模拟现实的传染病发展过程的计算机模型,做一些在现实世界中通过其他方法所不能做的实验,将结果进行对比分析。通过改变参数情况,观察哪些因素对于特定传染病爆发流行最重要,采取哪类措施[11] SWoIfmanm.TheoryandappIicationofCeIIuIar
Automata[M].WorIdScientific,Singaporem1986.
[12] AndersJohansen.ASimpIeModeIofRecurrentEpidemics[J].
JournaIofTheoreticaIBioIogy,1996,178(1):45-51.
[13] GChSirakouIis,IKarafyIIidisandAThanaiIakis.AceIIuIar
automatonmodeIfortheeffectsofpopuIationmovementandvaccination
on
epidemic
propagation[J].
EcoIogicaI
ModeIIing,2000,133(3);209-223.
[14] AdamKIeczkowski,BryanTGrenfeII.Mean-fieId-type
eguationsforspreadofepidemics:the“smaIIworId”modeI[J].PhysicaA,1999,274(1):355-360.
[15] LdeArcangeIisandHJHerrmann.SeIf-organizedcriticaIity
onsmaIIworIdnetworks[J].PhysicaA,2002,308(1):545-能够更有效地控制,何时采取效果最好。这种模型可以省去一般微分方程模型的复杂计算过程,并且比传统微分方程模型更易于直观分析,利用其模拟结果可以更好地为传染病防治决策提供支持。参考文献:
1] W
Kermack,A
G
Mckendrick.Contributions
to
the
mathematicaItheoryofepidemics[C].ProcRoySocA,1927,115(5):700-721.
2] W
Kermack,A
G
Mckendrick.Contributions
to
the
mathematicaItheoryofepidemics[C].ProcRoySocA,1932,138(1):55-83.
3] W0
Kermack,A
G
Mckendrick.Contributions
to
the
mathematicaItheoryofepidemics[C].ProcRoySocA,1933,141(1):94-122.
4] RMAnderson,RMMay.PopuIationbioIogyofinfectious
diseases
[J].Nature,1979,180:361!367.5] JMena2Iorca,HWHethcote.DynamicmodeIsofinfectious
diseasesasreguIationsofpopuIationsizes[J].JMathBioI,1992,30:693!716.
6] LOGao,HWHethcote.DiseasetransmissionmodeIswith
densitydependentdemographics[J].JMathBioI,1992,30:717!731.
7] DGreenhaIgh.HopfbifurcationinepidemicmodeIswithaIatent
periodandnonpermanentimmunity[J] .MathComput
ModeIing,
1997,25(2):85!107.8] HWHethcote.Themathematicsofinfectiousdiseases[J] .
SIAMev,2000,42:5999.
9] 马知恩,靳祯.总人口在变化的流行病动力学模型[J] .华
北工学院报,
2001;22(4):262!271.10] BChopard,MDroz著,祝玉学,赵学龙译.物理系统的元胞
自动机模型[M].清华大学出版社,2003.11-13.
—60—
549.
[16] MLMartinsa,etaI.AceIIuIarautomatamodeIforcitrus
variegatedchIorosis[J].PhysicaA295,2001.42!48.
[17] MAFuentes1,MNKuperman.
CeIIuIarautomataand
epidemioIogicaImodeIswithspatiaIdependence
[J].PhysicaA267,1999.471.
[18] 许田,等.流行病传播模型与SARS[J].自然杂志,26(1).[19] KHsu,HVGupta,SSorooshian.ArtificiaIneuraInetwork
modeIing
of
the
rain
faII
run
off
process
[J].WaterResourcesResearch,1995,31(10):2517—2530.
[20] 吴骁.人工神经网络在暴雨预测中的应用[M].智能控制与
智能自动化,北京:科学出版社,1993.
[21] 白艳萍,靳祯.人工神经网络在SARS疫情分析与预测中的
应用[J].数学的实践与认识,2004,34,5.
[22] 张建勋,等.基于神经网络的SARS传播模型[J].计算机工
程与应用,2004,23.
[22] RAIbert,ALBarabasi.StatisticaImechanicsofcompIeX
networks[J].ReviewofModernPhysics,2002,74:47-91.
[23] 车宏安,顾基发.无标度网络及其系统科学意义[J].系统工
程理论与实践,2004-4.11-16.
[24] RPastor-Satorras,AVespignani.Epidemicspreadingin
scaIe-freenetworks[J].Phys.Rev,Lett.2001,86:3200-
3203.
[作者简介]
余 雷
(1975.5-),男(汉族),湖北秭归人,西北工业大学自动化学院博士研究生,研究方向:复杂系统的建模与仿真。
薛惠锋
(1964.6-),男(汉族),山西万荣人,西北工业大学系统工程专业教授,博士生导师,研究方
向:系统工程。
李 刚
(1971.4-)男(汉族),湖北襄樊人,西北工业大学自动化学院博士研究生,研究方向:复杂系统的建模与仿真。
[[[[[[[[[[
传染病传播模型研究
作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:
余雷, 薛惠锋, 李刚, YU Lei, XUE Hui-feng, LI Gang西北工业大学资源与环境信息化工程研究所,陕西,西安,710072计算机仿真
COMPUTER SIMULATION2007,24(4)1次
参考文献(25条)
1.车宏安;顾基发 无标度网络及其系统科学意义[期刊论文]-系统工程理论与实践 2004(04)2.R Albert;A L Barabasi Statistical mechanics of complex networks 20023.张建勋 基于神经网络的SARS传播模型[期刊论文]-计算机工程与应用 2004(23)4.马知恩;靳祯 总人口在变化的流行病动力学模型[期刊论文]-华北工学院报 2001(04)5.H W Hethcote The mathematics of infectious diseases[外文期刊] 2000(4)
6.D Greenhalgh Hopf bifurcation in epidemic models with a latent period and nonpermanent immunity1997(02)
7.L Q Gao;H W Hethcote Disease transmission models with density dependent demographics 1992
8.J Mena2lorca;H W Hethcote Dynamic models of infectious diseases as regulations of population sizes 1992
9.R M Anderson;R M May Population biology of infectious diseases[外文期刊] 1979
10.W O Kermack;A G Mckendrick Contributions to the mathematical theory of epidemics 1933(01)11.R Pastor-Satorras;A Vespignani Epidemic spreading in scale-free networks[外文期刊] 2001(14)12.白艳萍;靳祯 人工神经网络在SARS疫情分析与预测中的应用[期刊论文]-数学的实践与认识 2004(05)13.吴骁 人工神经网络在暴雨预测中的应用 1993
14.K Hsu;H V Gupta;S Sorooshian Artificial neural network modeling of the rain fall run off process[外文期刊] 1995(10)
15.许田 流行病传播模型与SARS
16.M A Fuentes1;M N Kuperman Cellular automata and epidemiological models with spatial dependence1999
17.M L Martinsa A cellular automata model for citrus variegated chlorosis[外文期刊] 2001(1/2)18.L de Arcangelis;H J Herrmann Self-organized criticality on small world networks[外文期刊]2002(01)
19.Adam Kleczkowski;Bryan T Grenfell Mean-field-type equations for spread of epidemics:the "smallworld" model 1999(01)
20.G Ch Sirakoulis;I Karafyllidis;A Thanailakis A cellular automaton model for the effects ofpopulation movement and vaccination on epidemic propagation[外文期刊] 2000(03)21.Anders Johansen A Simple Model of Recurrent Epidemics[外文期刊] 1996(01)22.S Wolfmanm Theory and application of Cellular Automata 198623.B Chopard;M Droz;祝玉学;赵学龙 物理系统的元胞自动机模型 2003
24.W O Kermack;A G Mckendrick Contributions to the mathematical theory of epidemics 1932(01)25.W O Kermack;A G Mckendrick Contributions to the mathematical theory of epidemics 1927(05)
引证文献(1条)
1.付长贺.邓甦 马尔科夫链在传染病预测中的应用[期刊论文]-沈阳师范大学学报(自然科学版) 2009(1)
本文链接:http://d.g.wanfangdata.com.cn/Periodical_jsjfz200704016.aspx
第24卷 第04期
计 算 机 仿 真
2007年04月
文章编号:1006-9348(2007)04-0057-04
传染病传播模型研究
余雷,薛惠锋,李刚
(西北工业大学资源与环境信息化工程研究所,陕西西安710072)
摘要:用数学模型帮助发现传染病的传播机理,预测传染病的流行趋势已成为共识。主要简述了传染病模型的发展历程。传染病的数学模型研究分为两类:决定性模型和网络动力学模型。虽然决定论模型目前仍然具有非常重要的学术地位,但随着人工智能计算机技术的发展,目前网络动力学模型成为了新的研究热点。决定性模型主要介绍了SIS和SIR模型,网络动力学模型主要介绍了目前流行病数学模型中研究较多、应用较广的模型,包括元胞自动机、人工神经网络、无尺度网络模型。介绍了各种模型的研究方法,并且探讨了今后的研究热点,以利用其模拟结果可以更好地为传染病防治决策提供支持。关键词:传染病模型;元胞自动机;人工神经网络;无尺度网络中图分类号:N941;TP273
文献标识码:A
ResearchofEpidemicSpreadModel
YULei,XUEHui-feng,LIGang
(ResourceandEntertainmentInstitute,NorthwesternPoiytechnicaiUniversity,Contactaddress:
N0.26,NorthwesternPoiytechnicaiUniversity,Xi’an,Shanxi,710072,China)
ABSTRACT:Nowmathematicaimodeihasbecomeimportantmethodoiogyinforcastingtheepidemictrend.Thispaperintroducesbriefiythemodeiofepidemic.Inthispaper,themathematicsmodeioftheinfectiousdiseaseisdividedintotwokinds:Decisivemodeiandnetworkdynamicsmodei.Aithoughdecisivemodeistiiihastheextremeiyimportantacademicstatusatpresent,networkdynamicsmodeihasbecomethenewresearchhotspotatpresentaiongwiththeartificiaiinteiiigencecomputertechnoiogydeveiopment.WemainiyintroducesdecisivemodeiinciudingSISandSIRmodei.Thenetworkdynamicsmodeihasbeenrecommendedstudyingmoreandusingwidermodeiinthemathematicsmodeiofepidemicdiseaseatpresent,inciudingCeiiuiarAutomatamodei,artificiaineurainetworkmodei,scaiefreenetworkmodei.Thispaperintroducestheresearchapproachesofvariouskindsofmodeis,andprobesintotheresearchfocusinthefuture.Usingthesimuiationresuitscanprovidethesupportofdecision-makinginepidemicpreventingandcontroi.
KEYWORDS:Epidemicmodei;CeiiuiarAutomata;artificiaineurainetwork;scaiefreenetwork
中,人们不断地吸收最新数学和物理成果,使统计方法不断
1 引言
人类历史上曾多次受到危害极其严重的传染病的威胁,
得到改进,因此这种曾在历史上起过很大作用的方法直到今天仍然是重要的研究手段。目前,对传染病的研究有4种方法:描述性研究,分析性研究,实验性研究和理论性研究。在理论性研究中,数学模型起着极其重要的作用。它把传染病的主要特征通过假设、参数、变量和它们之间的联系清晰地揭示出来。数学模型的分析结果能提供许多强有力的理论基础和概念。用数学模型帮助发现传染病的传播机理,预测传染病的流行趋势已成为共识。纵观传染病的数学模型研究,我们可把它们分为两类:决定性模型和网络动力学模型。
目前决定论模型仍然具有非常重要的学术地位,但是随着人工智能计算机技术的发展,网络动力学模型成为了新的研究热点。本文主要就这两类模型介绍其研究方法,并且探
特别是在2002年冬到2003年春天,非典型肺炎(SARS)传染病突然侵袭了大半个中国,给国民经济和人民的正常活动都造成了很大的影响,由于人们对此种传染病的传播机理还不太清楚,因而一度引起了人们心理上的恐慌。因此,预防和控制传染病的研究就显得极其重要。
其实对传染病的描述和预测是人们由来已久的话题,最早使用的完全是总结经验型的统计方法。在漫长的研究过程
收稿日期:2006-05-25 修回日期:2006-06-08
—57—
讨了今后的研究热点。决定性模型主要介绍了SIS和SIR模型,网络动力学模型主要介绍了目前流行病数学模型中研究较多、应用较广的模型,包括元胞自动机、人工神经网络、无尺度网络模型。
如考虑时滞因素、年龄结构、隔离影响、变动人口等;模型维数上的增高;结合某些具体的传染病进行更为深入的研
[5,6,7,8,9]
究。
总体来说这些模型往往能给出与实际统计结果符合得相当不错的结果,说明它们抓住了流行病传播的一些基本动力学法则。然而,这种方法是决定论的,那就是认为如果模型方程中所有的参数和所有变量的初值都能精确知道,任何时刻的流行病演化情况就一定完全确定并可以无比精确地预言。这明显地与事实不符,流行病的传播过程中显然充满了偶然因素的影响。随着人工智能计算机技术的发展,目前网络动力学模型成为了新的研究热点。
2 决定性模型
虽然从1840年以来就有人试探运用简单的数学模型来
建立流行病传播的模型并进行预测,然而直到二十世纪的四五十年代,以微分方程为主的决定论模型才开始受到重视。决定论模型迄今为止仍然具有非常重要的学术地位。其中最有影响的是所谓SIR和SIS模型。
SIR模型是Kermack[1,2,3]
等人在1927年提出的一个传
染病的模型,这个模型得到了历史上发生过的大规模的传染病(如上世纪初在印度孟买发生的瘟疫)数据的有力支持,后来很多研究人员对SIR模型做了推广。
首先假定某地区的人群数是一个常数,把他们分为三个部分:易感人群、被感染者、恢复者。易感人群很容易被感染而还没有被感染(susceptibie),用S(t)表示;被感染者是已经被感染而且又将感染他人(infected),用(It)表示;恢复者是他们从流行病中获得免疫并恢复为正常人(susceptibie),用R(t)表示。也有一些流行病在治愈后并不能免疫,可能立即再次感染,肺结核和淋病常用作这样的例子。这时人群也可分为三组:未患病但可被感染(susceptibie)、病人且可传染别人(infected)、治愈但仍可感染(susceptibie),这就是SIS模型。
在SIR模型中分别用(st)、(It)、R(t)表示这三类人在t时刻的人口数,设病人的日接触率为!,日治愈率为",传染期接触数为#="/!,1/#称为相对移出率。设初始时刻的健康者和病人的比例分别是S0和 0,故SIR模型的方程为:
d dt
=!S -"
dS
dt=-!S dR
dt="
其中初值S(0)=S0,( 0)= 0,R(0)=R0
根据以上公式可以得出当易感染人数下降到S=1/#时,得病人数( t)达到最大值,而后得病人数逐渐减少,最终趋向于零。因此可以得知,如果在发病初期易感染的人数S0S1/#,
那么传染病就很快会被消灭。如果在发病初期易感染的人数S0>1/#,那么得病人数先增加,当其达到最大值时,然后逐渐减少直至消灭。
早期的传染病模型大多假设种群总数为常数或者渐近常数,这在时间较短、环境封闭等特定条件下是合理的,但在实际问题中,研究总人口具有种群动力学的流行病模型。这
类模型已被AndersonandMay[4]
在实验室所验证。近期所研
究的模型大致有三个发展方向:模型所涉及的因素增多,例
—58—
3 网络动力学模型
网络动力学被认为是非线性科学研究的一种,它主要包
括元胞自动机、布尔网络、神经网络以及L-系统等。网络动力学的基本结构可以采用数学中的图来描述,而构成网络的结点的状态转移也遵循相同的局部规则,网络动力学模型都具有结构与规则固定的特征。比较典型的网络动力学模型有:元胞自动机、人工神经网络、L-系统、随机布尔网络、无尺度网络等模型,其中元胞自动机、人工神经网络和无标度网络是目前流行病数学模型中研究较多、应用较广的模型。3.1
元胞自动机模型
元胞自动机(CeiiuiarAutomata,简称CA),也译为细胞自动机、点格自动机、分子自动机或单元自动机,它是时间和
空间都离散的动力模型[10]
。20世纪40年代初,现代计算机的
创始人之一冯・诺依曼开始思考描述生物自我繁衍的逻辑形式,提出了元胞自动机的概念。尽管是一个伟大的设想,但受制于当时计算机能力的限制,直到20世纪80年代,S.
Woifram[11]才对元胞自动机进行了全面的研究。
按照元胞自动机的定义,用数学符号来表示,元胞自动机可以视为由一个元胞空间和定义于该空间的变换函数所组成。元胞自动机用形式语言的方式来描述,可以用一个四元组表示:
A=(Ld,S,N,f)
在这里A代表一个元胞自动机系统,Ld代表一个规则划分的网格空间,每个网格单元(cell)就是一个元胞;L通常为一维或二维空间,但理论上可以是一个任意正整数维的规则空间。S代表一个离散的有限集合,用来表示各个元胞的状态;N代表元胞的邻居集合,对于任何元胞的邻居集合NCL,设邻居集合内元素数目为小I,那么,N可以表示为一个所有邻域内元胞的组合(包括中心元胞),即包含I个不同元胞状态的一个空间矢量,记为:
N=(S1,S2,S3,…SI),SiEZ(整数集合),iE(1,…I)
f表示一个映射函数:SIt_St+1,即根据t时刻某个元胞的所有邻居的状态组合来确定t+1时刻该元胞的状态值。f通常又被称为状态转换函数,或局部规则。
目前元胞自动机已经成为复杂性研究中网络动力学的典型代表,它的提出为许多复杂系统的研究提供了有力的工具。因此,用元胞自动机描述传染病传播的方法逐渐受到了重视,尤其在20世纪90年代中期以后出现了大量研究论
[12,13,14,15,17,18]文。
功能函数的确定:BP神经网络的功能函数要求处处可微分且收敛。目前的研究多用Sigmoid函数f(/1+1x)=1(
x-x
e-x),极少使用双曲正切函数厂f((/ex+2x)=(e-e)
e-x)作为网络功能函数。
用人工神经网络建立传染病数学模型具有以下优点:1)通过学习可以逼近任意非线性映射,不受非线性模型的限制。
2)高度的并行分布式处理能力,分布式处理能力体现在网络的各个连接权系数上。
3)具有联想记忆、自组织、自学习能力,能根据环境的变化自动调整自己的能力(反映在连接权系数上),不需人工干目前国内用元胞自动机建立传染病数学模型的还不多,
[19]
等人根据国外的文献,将SARS传染数据通许田、张培培
过SIR模型和元胞自动机模型对比,认为决定论模型拟合得到的完全光滑曲线对应原胞自动机模型在无限大空间中或有限空间中无限多次重复取平均的结果。3.2
人工神经网络模型
人工神经网络模型是以生物体的神经系统工作原理为基础而建立的一种网络模型。网络中的基本单元是类似于生物神经元的人工神经元,也是一种广义的自动机;由许许多多类似的人工神经元经一定方式连接起来形成的网络,表现出系统的整体性行为。
近年来人工神经网络(ANN)在传染病分析与预测中的应用也越来越广泛。人工神经网络具有自组织、自适应及自学习功能。其中误差反向传播网络BP网络是一种非线性映射人工神经网络。RobertHechtNieison证明了对于任意闭合区间连续函数都可以用含有一个隐层的BP网络来逼近。当网络训练好之后,就可以用来预测传染病的流行趋势。一些研究表明,应用BP网络具有较高的预测精度
[20,21,22]
。
BP神经网络模型是人工神经网络中应用最广泛的一种。它的功能函数为S型函数,神经元连接形式为前馈神经网络,学习方式为有监督学习。
BP学习算法实质上是最小均方(LMS)算法的推广,是一种非线性梯度优化算法,因此不可避免地存在局部极小值问题。学习算法的收敛速度很慢,通常需要上千次迭代或更多。
利用神经网络来建立传染病发病率预测模型时需要确定神经网络BP训练中的模型参数。模型参数包括模型层数、隐含层节点数和功能函数。
模型层数的确定尚无统一方法。白艳萍,靳祯
[21]
采用了6个神经元的两层前向神经网络来预测与分析SARS传染病的流行趋势,输入层为一个神经元,隐含层为四个神经元,输出层为一个神经元。但目前多数人认为2个隐含层的ANN与1个隐含层的ANN进行比较,前者易陷入局部极小,误差在局部极小处振荡,在同样学习次数的训练中,二者所达到的
误差相近,因而选用3层BP神经网络模型[22]
。
节点数包括输入输出层节点数和隐含层节点数,输入节点一般为输入变量的个数,输出层节点为传染病每天发病数。隐含层节点数目的确定难度较大,若隐含层节点太少,网络可能不能训练;若网络节点数太多,网络训练可能无穷无尽,不易收敛。在选取隐含层节点数时,根据最小上界(ieastupperbound,LUB)理论,在大多数文献中取隐含层节点数为4-6。
预。
但是BP神经网络也具有收敛速度慢、可能收敛到局部极值等缺弱点。3.3
无标度网络模型
传统的随机网络(如ER模型),尽管连接是随机设置的,但大部分节点的连接数目会大致相同,即节点的分布方式遵循钟形的泊松分布,有一个特征性的“平均数”。连接数目比平均数高许多或低许多的节点都极少,随着连接数的增大,其概率呈指数式迅速递减.故随机网络亦称指数网络。
1999年,A-L.Barabasi和R.Aibert等提出了一个“无标度网络”模型,由此揭开了复杂网络研究的新篇章。A-L.Barabasi等人开展一项描绘万维网的研究。他们原本以为会发现一个随机网络的钟形分布图,但结果他们却意外发现,万维网基本上是由少数高连通性的页面串连起来的,80%以上的页面连接数不到4个,而占节点总数不到万分之一的极少节点,却和1000个以上的节点连接。随机网络具有的大多数节点连接数相同的性质不见了。他们把这种网络称为“无
标度网络(Scaie-FreeNetworks)”[22]。
无标度网络具有稳健性和脆弱性双重特性,都源于其存在集散节点。SARS的传播,也使我们看到无标度网络的稳健
性和脆弱性所具有的现实的重要性[23]
。
2001年P-Satorras等人研究了一个由BA模型产生的无限大无标度网上的SIS传播模型,
证明了规律!~exp(-C/")(C为常数),这里!定义为“传播达到稳定时曾患病人所占比例”,称为“流行度”。这个规律说明对于再小的有效传播率",流行度也不为零。这说明无标度网抵抗流行病的
能力很弱,可以在任意小的有效传播率之下维持传播[24]。在
前面介绍决定性模型中可以看出,根据数学模型应该存在着一个不为零的有效传播率阈值"c,只有超过阈值时流行度才不为零,这与无标度网络得出的结论是不一样的。
目前无标度网络研究传染病的文章还处于起步阶段,但正在逐步成为一个新的热点。
4 结论
本文主要简述了流行病模型的发展历程。传染疾病的传
播过程中充满了偶然因素的影响,它的传播显然是一种复杂
—59—
现象,需要纳入新兴的复杂性科学的研究之中。但是也有其固有缺点,对于复杂现象只能作趋势的预测,而做不到精确的预测。而决定性模型在应用中往往能给出与实际统计结果符合得相当不错的结果,所以目前仍然具有非常重要的学术地位。
流行病模型长期以来都是研究的热点之一,文献的数量庞大,但在国内目前从复杂系统的角度来进行研究的还不是很多,所以下一步的主要工作就是复杂系统的角度来进行。我们可以用网络动力学模型建立能够模拟现实的传染病发展过程的计算机模型,做一些在现实世界中通过其他方法所不能做的实验,将结果进行对比分析。通过改变参数情况,观察哪些因素对于特定传染病爆发流行最重要,采取哪类措施[11] SWoIfmanm.TheoryandappIicationofCeIIuIar
Automata[M].WorIdScientific,Singaporem1986.
[12] AndersJohansen.ASimpIeModeIofRecurrentEpidemics[J].
JournaIofTheoreticaIBioIogy,1996,178(1):45-51.
[13] GChSirakouIis,IKarafyIIidisandAThanaiIakis.AceIIuIar
automatonmodeIfortheeffectsofpopuIationmovementandvaccination
on
epidemic
propagation[J].
EcoIogicaI
ModeIIing,2000,133(3);209-223.
[14] AdamKIeczkowski,BryanTGrenfeII.Mean-fieId-type
eguationsforspreadofepidemics:the“smaIIworId”modeI[J].PhysicaA,1999,274(1):355-360.
[15] LdeArcangeIisandHJHerrmann.SeIf-organizedcriticaIity
onsmaIIworIdnetworks[J].PhysicaA,2002,308(1):545-能够更有效地控制,何时采取效果最好。这种模型可以省去一般微分方程模型的复杂计算过程,并且比传统微分方程模型更易于直观分析,利用其模拟结果可以更好地为传染病防治决策提供支持。参考文献:
1] W
Kermack,A
G
Mckendrick.Contributions
to
the
mathematicaItheoryofepidemics[C].ProcRoySocA,1927,115(5):700-721.
2] W
Kermack,A
G
Mckendrick.Contributions
to
the
mathematicaItheoryofepidemics[C].ProcRoySocA,1932,138(1):55-83.
3] W0
Kermack,A
G
Mckendrick.Contributions
to
the
mathematicaItheoryofepidemics[C].ProcRoySocA,1933,141(1):94-122.
4] RMAnderson,RMMay.PopuIationbioIogyofinfectious
diseases
[J].Nature,1979,180:361!367.5] JMena2Iorca,HWHethcote.DynamicmodeIsofinfectious
diseasesasreguIationsofpopuIationsizes[J].JMathBioI,1992,30:693!716.
6] LOGao,HWHethcote.DiseasetransmissionmodeIswith
densitydependentdemographics[J].JMathBioI,1992,30:717!731.
7] DGreenhaIgh.HopfbifurcationinepidemicmodeIswithaIatent
periodandnonpermanentimmunity[J] .MathComput
ModeIing,
1997,25(2):85!107.8] HWHethcote.Themathematicsofinfectiousdiseases[J] .
SIAMev,2000,42:5999.
9] 马知恩,靳祯.总人口在变化的流行病动力学模型[J] .华
北工学院报,
2001;22(4):262!271.10] BChopard,MDroz著,祝玉学,赵学龙译.物理系统的元胞
自动机模型[M].清华大学出版社,2003.11-13.
—60—
549.
[16] MLMartinsa,etaI.AceIIuIarautomatamodeIforcitrus
variegatedchIorosis[J].PhysicaA295,2001.42!48.
[17] MAFuentes1,MNKuperman.
CeIIuIarautomataand
epidemioIogicaImodeIswithspatiaIdependence
[J].PhysicaA267,1999.471.
[18] 许田,等.流行病传播模型与SARS[J].自然杂志,26(1).[19] KHsu,HVGupta,SSorooshian.ArtificiaIneuraInetwork
modeIing
of
the
rain
faII
run
off
process
[J].WaterResourcesResearch,1995,31(10):2517—2530.
[20] 吴骁.人工神经网络在暴雨预测中的应用[M].智能控制与
智能自动化,北京:科学出版社,1993.
[21] 白艳萍,靳祯.人工神经网络在SARS疫情分析与预测中的
应用[J].数学的实践与认识,2004,34,5.
[22] 张建勋,等.基于神经网络的SARS传播模型[J].计算机工
程与应用,2004,23.
[22] RAIbert,ALBarabasi.StatisticaImechanicsofcompIeX
networks[J].ReviewofModernPhysics,2002,74:47-91.
[23] 车宏安,顾基发.无标度网络及其系统科学意义[J].系统工
程理论与实践,2004-4.11-16.
[24] RPastor-Satorras,AVespignani.Epidemicspreadingin
scaIe-freenetworks[J].Phys.Rev,Lett.2001,86:3200-
3203.
[作者简介]
余 雷
(1975.5-),男(汉族),湖北秭归人,西北工业大学自动化学院博士研究生,研究方向:复杂系统的建模与仿真。
薛惠锋
(1964.6-),男(汉族),山西万荣人,西北工业大学系统工程专业教授,博士生导师,研究方
向:系统工程。
李 刚
(1971.4-)男(汉族),湖北襄樊人,西北工业大学自动化学院博士研究生,研究方向:复杂系统的建模与仿真。
[[[[[[[[[[
传染病传播模型研究
作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:
余雷, 薛惠锋, 李刚, YU Lei, XUE Hui-feng, LI Gang西北工业大学资源与环境信息化工程研究所,陕西,西安,710072计算机仿真
COMPUTER SIMULATION2007,24(4)1次
参考文献(25条)
1.车宏安;顾基发 无标度网络及其系统科学意义[期刊论文]-系统工程理论与实践 2004(04)2.R Albert;A L Barabasi Statistical mechanics of complex networks 20023.张建勋 基于神经网络的SARS传播模型[期刊论文]-计算机工程与应用 2004(23)4.马知恩;靳祯 总人口在变化的流行病动力学模型[期刊论文]-华北工学院报 2001(04)5.H W Hethcote The mathematics of infectious diseases[外文期刊] 2000(4)
6.D Greenhalgh Hopf bifurcation in epidemic models with a latent period and nonpermanent immunity1997(02)
7.L Q Gao;H W Hethcote Disease transmission models with density dependent demographics 1992
8.J Mena2lorca;H W Hethcote Dynamic models of infectious diseases as regulations of population sizes 1992
9.R M Anderson;R M May Population biology of infectious diseases[外文期刊] 1979
10.W O Kermack;A G Mckendrick Contributions to the mathematical theory of epidemics 1933(01)11.R Pastor-Satorras;A Vespignani Epidemic spreading in scale-free networks[外文期刊] 2001(14)12.白艳萍;靳祯 人工神经网络在SARS疫情分析与预测中的应用[期刊论文]-数学的实践与认识 2004(05)13.吴骁 人工神经网络在暴雨预测中的应用 1993
14.K Hsu;H V Gupta;S Sorooshian Artificial neural network modeling of the rain fall run off process[外文期刊] 1995(10)
15.许田 流行病传播模型与SARS
16.M A Fuentes1;M N Kuperman Cellular automata and epidemiological models with spatial dependence1999
17.M L Martinsa A cellular automata model for citrus variegated chlorosis[外文期刊] 2001(1/2)18.L de Arcangelis;H J Herrmann Self-organized criticality on small world networks[外文期刊]2002(01)
19.Adam Kleczkowski;Bryan T Grenfell Mean-field-type equations for spread of epidemics:the "smallworld" model 1999(01)
20.G Ch Sirakoulis;I Karafyllidis;A Thanailakis A cellular automaton model for the effects ofpopulation movement and vaccination on epidemic propagation[外文期刊] 2000(03)21.Anders Johansen A Simple Model of Recurrent Epidemics[外文期刊] 1996(01)22.S Wolfmanm Theory and application of Cellular Automata 198623.B Chopard;M Droz;祝玉学;赵学龙 物理系统的元胞自动机模型 2003
24.W O Kermack;A G Mckendrick Contributions to the mathematical theory of epidemics 1932(01)25.W O Kermack;A G Mckendrick Contributions to the mathematical theory of epidemics 1927(05)
引证文献(1条)
1.付长贺.邓甦 马尔科夫链在传染病预测中的应用[期刊论文]-沈阳师范大学学报(自然科学版) 2009(1)
本文链接:http://d.g.wanfangdata.com.cn/Periodical_jsjfz200704016.aspx