基于数学模型的疾病预测方法比较研究

第8卷%第5期

软件导刊

2009年5月Software Guide

Vol.8No.5May. 2009

基于数学模型的疾病预测方法比较研究

袁莺楹,董建成

(南通大学公共卫生学院,江苏南通226001)

要:疾病的发生发展是一种复杂的现象,准确地预测人群以及个体疾病的发展趋势成为人们预防疾病的一个重

要手段。综述了当前疾病预测中常用的几种数学模型的方法,对回归预测法、时间序列预测法、灰色预测法、Markov 预测法、人工神经网络法等进行了简单介绍,并对这几种方法的特点、适用范围做了比较分析,便于在不同的情况和不同的精度要求下,选择合适的方法进行预测。关键词:疾病;预测;数学模型中图分类号:TP311.52

文献标识码:A

文章编号:1672-7800(2009)05-0108-03

1定性预测

定性预测又可称直观判断预测,它主要依靠预测人员的经

定性预测法能充分发挥人的主观作用,考虑某些无法定量的因素,有较大的灵活性,省时省费用,但它缺乏数量上的精确描述,易受人的经验和主观判断能力束缚,因此它的准确程度就主要取决于预测者的经验、理论素质、业务水平以及掌握的情况和分析判断能力。

验和直观判断能力,不用或仅用少量的计算,根据预测对象过去和现在的有关资料以及相关因素的分析,对预测对象的未来状况作出判断,得到预测结果,普遍适用于一些缺乏历史数据的事件,主要预测方法有Delphi 法、主观概率法、模糊聚类预测法等。吕晓燕等介绍了一种基于模糊聚类分析的医学疾病预测诊断模型的设计思想与方法,将预测患者与已确诊的患者放到一起,进行模糊聚类分析,通过把预测患者划入某一相似病例组,从而达到疾病预测诊断的目的。该模型应用于临床疾病诊断的符合率达91.7%,取得了较为理想的效果。

[4]

2定量预测

定量预测是运用统计方法和数学模型,通过对过去一些历

史数据的统计分析,对事物未来的发展趋势、增减速度以及可能达到的发展水平作出数量的说明,并且以数学模型来表达基本规律,从而对未来发展进行预测。在定量预测中,数学模型的思想是各种预测方法的建构核心,下文介绍疾病预测中几种常

[6][7]

陈贵海,吴帆,李宏兴,等. 基于DHT 的P2P 系统中高可用数据冗余机制[J ]. 计算机学报,2008(10).

陈浩,孙建华,金海. 对等网络中平均最短路径长度的分析[J ]. 小型微型计算机系统,2006(3).

(责任编辑:王

钊)

Zhou Guoqiang ,Pan Fangrui ,Zhang Weifeng. Research Progress of Trust Evaluation Model [J ].Wuhan University Journal of Natural Sc -iences.2008,13(4).

[5]I STOICA ,R MORRIS ,D LIBEN2NOWELL ,et al. Chord :A Scalable peer-to-peer lookup protocol for internet applications [J ]. IEEE/ACMTransactions on Networking ,2003,11(1).

A Global Trust Management Model for P2P Network

Abstract :In P2P environment, all kinds of open, dynamic and changeful applications post more demands for network security and relia -bility. Based on evaluation among peers, this paper introduce improved DHT to establish trust model to ensure the availability of trust in -formation and resolve high maintenance costs caused by the join and exit of nodes, and thus enhance the performance of the system. Key Words :P2P ;Trust Management ;Availability ;DHT

作者简介:袁莺楹(1982-),女,江苏南通人,南通大学公共卫生学院硕士研究生,研究方向为医学信息学;董建成(1957-),男,江苏南通人,南通大

学教授、硕士生导师,研究方向为数据挖掘、电子病历。

第5期袁莺楹,董建成:基于数学模型的疾病预测方法比较研究

·109·

用的定量预测法:回归分析法、时间序列分析法、灰色系统预测法、马尔柯夫(Markov )预测法、人工神经网络法等。这些方法都运用了数学建模的思想,建立过程中隐含了建模的几个基本步骤:①模型的假设,通过合理的假设简化实际问题,舍弃其中的次要因素,考虑其中的最主要的因素;②模型的建立,将实际问题转化成数学问题;③模型的求解,求出数学问题的答案;④模型的检验和应用,把数学问题的解应用于实际问题的解决,是数学建模思想在疾病预测方面的一个应用。

定量预测比较客观,它更多地依靠历史数据,注重从数量上对疾病发展作精确描述,较少受主观因素的影响,可利用计算机程序进行大量数据处理,因此在疾病预测中应用较为广泛。

2.1回归预测法

回归预测法是分析疾病与致病因子之间的联系,建立回归

方程式(回归模型),再根据回归模型对疾病的变化作出预测的研究方法。根据考虑致病因子的多少、疾病与致病因子的关系可分为一元线性回归预测法、多元线性回归线性预测法和非线性回归预测法。利用回归分析预测疾病在医学统计中应用广泛且技术较成熟,能够综合考虑多种因素的共同作用,但模型误差较大、外推性差,要的数据量大,并且对样本的分布有较高的要求。

2.2时间序列预测法

所谓时间序列预测法,就是把预测对象的历史数据按一定

的时间间隔进行排列,构成一个随时间变化的统计序列,建立相应的数据随时间变化的变化模型,并将该模型外推到未来进行预测。美国统计学家Ceogre E.P.Box 和英国统计学家Gwil -

vm M.Jenkins 提出的博克斯一詹金斯法(简称B-J 法或ARMA

模型法)是时间序列建模中最重要和最常用的预测手段。AR -

MA 模型法要求作为预测对象的时间序列必须是平稳序列,而

很多医学现象随着时间的推移都表现出上升或下降趋势,构成非平稳的时间序列,所以运用d 阶齐次非平稳时序的求和自回归滑动平均模型(ARMIA 模型):Φ(B )

·(1-B )d X t =Θ(B )αt ,因多数医学卫生现象都不平稳,故ARMIA 模型较为常用。

2.3马尔柯夫(Markov )预测法

马尔柯夫预测是将整个时间序列划分成若干状态,根据状

态之间的转移概率预测事物可能的状态区间,它是一种区间预测,最后预测的是实际值出现的范围。Markov 链是一个随机事件序列,是状态和时间都离散的Markov 过程,它具有无后效性(也就是说某事件的将来是什么状态,其概率有多大,只取决于事物现在所处的状态如何,而与以前的状态无关),主要研究状态之间的转移概率。比如在t 时刻某疾病处于状态s ,则在t +1时刻它将以概率p 处于状态S k ,p 即为状态S j 转移到S k 的转移概率,假设经过i 步转移,则转移概率记为P (i )

jk ,进而得到步状态转移概率矩阵为P (i )

=P (i )

jk

i ,j-1,…,n

。可以看出状态转移概率矩

阵反映了疾病由某种状态转移到各种状态的可能性大小,可以通过它来预测疾病的未来变化。臧春鹏根据徐州市1983~1997年伤寒发病数据,将伤寒的发病率划分为若干状态,计算各状

态间的转移次数,确定转移概率矩阵,根据矩阵中最大转移概率作出预报,1998年的预测结果与实际完全吻合。

2.4灰色系统预测法

灰色系统理论是我国著名学者邓聚龙教授1982年创立的

一门新兴学科,通过对原始数据的处理和灰色模型的建立,发现、掌握疾病的发展规律,对疾病的未来发展作出科学的定量预测。

和传统的预测方法相比,灰色预测只需要较少的几个数据就可建立模型进行预测,对于时间短、数据资料少、波动性不大的预测问题,预测精度较高。它目前最常用的预测模型为GM (1,1),它表示一个变量的一阶微分方程,只研究时间这个综合灰色量对某种疾病的作用,常用来推断疾病在将来的某一时刻或某几个时刻的发病率或死亡率。关志强等将灰色预测应用在健康数据预测上,把个人体检中血压的历史数据作为样本点,经过模型计算预测出未来一段时间的身体指标,对个体疾病预防起到一定的作用。石长胜等应用GM (1,1)模型对泰安市病毒性肝炎1971~1996年发病资料进行了拟合分析,对灾变(流行)可能发生的时间作出预测。GM (1,1)模型简单,对致病的影响因素基本不考虑,样本量少,这些特点也同样导致预测的粗糙性,对疾病的流行趋势只能做近期预测,适合指数增长的预测,对随机性、波动性较大的数据拟合预测结果较差。而GM (1,N )模型是分析模型、因子模型,表示N 个变量的一阶微分方程,它不具有全信息,一般不适合于多因素预测。

2.5人工神经网络预测法

人工神经网络(Artificial Neural Network ,ANN ),一种模仿动

物神经网络行为特征,进行分布式并行信息处理的算法数学模型。它是在对人脑神经网络的基本认识的基础上,从信息处理的角度用数理方法对人脑进行抽象,并建立某种简化模型。人工神经网络具有非线性容错性和自组织自学习自推理的自适应能力,能够通过对样本的学习训练,不断改变网络的连接权以及拓扑结构,以使网络的输出不断地接近期望的输出。它不需要分析相关因素的具体关系,通过一定样本的学习训练就能够自己总结出复杂的内在规律,从而进行疾病预测。

BP 神经网络是目前应用最为广泛的一种多层前馈网络,

在流行病学中,可以运用BP 网络建立疾病的预测模型。首先收集导致疾病发生的主要影响因素及疾病发生的结果;将影响因素及疾病结果输入到设计好的神经网络模型中进行反复训练,直到达到预期的训练误差;最后用建立好的模型进行疾病预测。王俊杰等筛选出影响精神分裂症发病的10个主要因素,并赋初值,将精神病新发病例和对照组输入设计好的BP 神经网络进行训练,最后再将测试组输入系统进行测试,预测的一致率为87.5%,前瞻性考核的效果较好。侯木舟等利用BP 神经网络法,得出预测数据的脑电地形图,将其与正常的脑电地形图进行比较,对大脑的病理状态进行分析,为脑疾病如癫痫病的诊断、预测和治疗提供依据。可见,BP 神经网络是一种非传统的多元非线性模型,可以识别变量间复杂的非线性关系,功能十分强大,而且无论变量是何种类型,是否满足正态性、独立性等条件均可用BP 网络建模。而BP 神经网络的设计直接关

·110·

表1

特点

回归预测法

软件导刊

定量预测法的比较

不足

当受随机扰动等错综因素影响时,误差较大,外推性差

2009年

适用范围适合中长期预测

能考虑疾病的各影响因素及相关关系;但要求样本量大且有较好的分布规律

时间序列预测法

不用考虑各影响因素,用时间变量来综合代表各影响因不能充分利用疾病影响因素间的相关关系;当遇到波素,简单易行易掌握;但要求样本序列平稳,波动性不大是区间预测,得到的结果是一个可能的区间,预测的准确度高;特别适用于波动性大的资料

是一种时间序列预测法,适合样本少、信息不全,且指数增长的预测

具有非线性容错性、自学习、自组织与自适应性,是一种

动性大的数据预测效果差

由于是区间预测,必然导致预测的精确度不高

短期预测精度较高

马尔柯夫预测法短期预测精度高

灰色系统预测法对随机性、波动性较大的数据拟合预测结果较差

人工神经网络法变结构模型,可以通过对样本的学习而不断地改变自身网络结构确定困难;算法复杂,容易陷入局部极小点

的数据结构,从而适应样本的变化

系到网络的应用效果,在应用时按照资料的特点从每一细节考虑网络的设计。

病的未来流行趋势,主要预测疾病的发病率、死亡率以及流行病的爆发点,对传染病的防制和各项卫生政策的制定起到重要的作用。在个体的疾病诊断预测方面,BP 神经网络模型应用较多,因为疾病的发病过程本是一个受多因素影响的复杂过程(例如遗传因素、生活方式、健康干预等等),传统的统计方法预测疾病的发生过程往往存在很大的局限性,而BP 神经网络的优点恰恰适合预测疾病的发生过程。因此今后可以尝试建立多种BP 神经网络模型对相应的疾病进行患病风险的预测,使得疾病能够早发现早诊治,提高早期的治愈率。

参考文献:[1][2][3][4][5][6][7][8][9][10][11][12]

徐国祥. 统计预测和决策[M ]. 上海:复旦大学出版社,1994. 吕晓燕,郭建军,李祥生. 一种基于模糊聚类分析的疾病电脑预测诊断方法[J ]. 电脑开发与应用,2003(12).

谭莘,田考聪. 数学模型在人群疾病预测研究中的应用[J ]. 中国医院统计,2005(1).

施仁杰. 马尔科夫链基础及其应用[M ]. 西安:西安电子科技大学出版社,1992.

江之源. 经济预测方法与模型[M ]. 成都:西南财经大学出版社,

3几种定量预测法的比较分析

定量预测的几种方法是疾病预测中常用到的方法,它们有

各自的特点,有的方法在短中期预测中精度较高,有的方法在长期预测中较有优势;有的对平稳数据较适用,有的却特别适用于有波动性改变的资料。表1分别列出了几种预测方法的特点和不足,便于进一步比较分析各种方法的优势和适用范围。

从表1中,我们可以看到各种预测方法在研究的角度、运用的数据形式、数据样本大小以及适用条件等方面都有所不同。从适用条件看,回归预测法适用于大样本且前后发展模式不变的预测;灰色模型预测法是通过对原始数据的整理来寻求规律,它适用于少信息或信息不明条件下的分析和预测。从数据的形式看,灰色系统理论是采用生成数据建模;回归分析法是采用原始数据建模;而马尔柯夫法是通过计算转移概率来预测未来值区间。从数据的特点看,时间序列法、灰色模型预测法、回归预测法要求数据平稳、波动性小;马尔柯夫预测法则适合于波动性较大的数据。从适用的时间分类看,时间序列、马尔柯夫、灰色模型法较适宜近期预测,对中长期预测,采用回归预测法。而神经网络法不受这些因素的限制,它是一种变结构模型,可以通过对样本的学习而不断地改变自身的数据结构,从而适应样本的变化,但是它的网络结构很难确定,算法比较复杂,对预测人员的思维科学、人工智能、计算机科学等多学科的知识要求很高,对于一般预测人员,模型的建立存在一定的困难。

由于每种单一的预测方法总有缺陷,1969年Bates 和

1999.

臧春鹏.Markov 模型在伤寒发病趋势预测中的应用[J ]. 江苏预防医学,1999(4).

邓聚龙. 灰色理论基础[M ]. 武汉:华中科技大学出版社,2002. 关志强,陈谊. 灰色模型在健康数据预测中的应用[J ]. 北京工商大学学报,2008.

石长胜,张振民. 灰色系统模型在病毒性肝炎暴发流行预测中的应用[J ]. 疾病监测,1997(12).

韩力群. 人工神经网络理论、设计与应用[M ]. 北京:化学工业出版社,2007.

王俊杰,陈景武.BP 神经网络在疾病预测中的应用[J ]. 数理医药学杂志,2008(3).

侯木舟,韩旭里,黄献.BP 神经网络在脑电图信号预测中的应用[J ]. 计算机工程与设计,2006(14).

(责任编辑:卓

光)

Granger 首次提出组合预测方法,它将不同的预测方法按一定

的方式综合,充分发挥各预测方法的优势,相互弥补不足,以求更佳的预测效果。尽管组合预测能够扬长避短,但理论还不够完善,目前它的发展仍处于不够成熟阶段。

4结束语

目前,疾病预测的前4种方法着重于研究整个人群某种疾

第8卷%第5期

软件导刊

2009年5月Software Guide

Vol.8No.5May. 2009

基于数学模型的疾病预测方法比较研究

袁莺楹,董建成

(南通大学公共卫生学院,江苏南通226001)

要:疾病的发生发展是一种复杂的现象,准确地预测人群以及个体疾病的发展趋势成为人们预防疾病的一个重

要手段。综述了当前疾病预测中常用的几种数学模型的方法,对回归预测法、时间序列预测法、灰色预测法、Markov 预测法、人工神经网络法等进行了简单介绍,并对这几种方法的特点、适用范围做了比较分析,便于在不同的情况和不同的精度要求下,选择合适的方法进行预测。关键词:疾病;预测;数学模型中图分类号:TP311.52

文献标识码:A

文章编号:1672-7800(2009)05-0108-03

1定性预测

定性预测又可称直观判断预测,它主要依靠预测人员的经

定性预测法能充分发挥人的主观作用,考虑某些无法定量的因素,有较大的灵活性,省时省费用,但它缺乏数量上的精确描述,易受人的经验和主观判断能力束缚,因此它的准确程度就主要取决于预测者的经验、理论素质、业务水平以及掌握的情况和分析判断能力。

验和直观判断能力,不用或仅用少量的计算,根据预测对象过去和现在的有关资料以及相关因素的分析,对预测对象的未来状况作出判断,得到预测结果,普遍适用于一些缺乏历史数据的事件,主要预测方法有Delphi 法、主观概率法、模糊聚类预测法等。吕晓燕等介绍了一种基于模糊聚类分析的医学疾病预测诊断模型的设计思想与方法,将预测患者与已确诊的患者放到一起,进行模糊聚类分析,通过把预测患者划入某一相似病例组,从而达到疾病预测诊断的目的。该模型应用于临床疾病诊断的符合率达91.7%,取得了较为理想的效果。

[4]

2定量预测

定量预测是运用统计方法和数学模型,通过对过去一些历

史数据的统计分析,对事物未来的发展趋势、增减速度以及可能达到的发展水平作出数量的说明,并且以数学模型来表达基本规律,从而对未来发展进行预测。在定量预测中,数学模型的思想是各种预测方法的建构核心,下文介绍疾病预测中几种常

[6][7]

陈贵海,吴帆,李宏兴,等. 基于DHT 的P2P 系统中高可用数据冗余机制[J ]. 计算机学报,2008(10).

陈浩,孙建华,金海. 对等网络中平均最短路径长度的分析[J ]. 小型微型计算机系统,2006(3).

(责任编辑:王

钊)

Zhou Guoqiang ,Pan Fangrui ,Zhang Weifeng. Research Progress of Trust Evaluation Model [J ].Wuhan University Journal of Natural Sc -iences.2008,13(4).

[5]I STOICA ,R MORRIS ,D LIBEN2NOWELL ,et al. Chord :A Scalable peer-to-peer lookup protocol for internet applications [J ]. IEEE/ACMTransactions on Networking ,2003,11(1).

A Global Trust Management Model for P2P Network

Abstract :In P2P environment, all kinds of open, dynamic and changeful applications post more demands for network security and relia -bility. Based on evaluation among peers, this paper introduce improved DHT to establish trust model to ensure the availability of trust in -formation and resolve high maintenance costs caused by the join and exit of nodes, and thus enhance the performance of the system. Key Words :P2P ;Trust Management ;Availability ;DHT

作者简介:袁莺楹(1982-),女,江苏南通人,南通大学公共卫生学院硕士研究生,研究方向为医学信息学;董建成(1957-),男,江苏南通人,南通大

学教授、硕士生导师,研究方向为数据挖掘、电子病历。

第5期袁莺楹,董建成:基于数学模型的疾病预测方法比较研究

·109·

用的定量预测法:回归分析法、时间序列分析法、灰色系统预测法、马尔柯夫(Markov )预测法、人工神经网络法等。这些方法都运用了数学建模的思想,建立过程中隐含了建模的几个基本步骤:①模型的假设,通过合理的假设简化实际问题,舍弃其中的次要因素,考虑其中的最主要的因素;②模型的建立,将实际问题转化成数学问题;③模型的求解,求出数学问题的答案;④模型的检验和应用,把数学问题的解应用于实际问题的解决,是数学建模思想在疾病预测方面的一个应用。

定量预测比较客观,它更多地依靠历史数据,注重从数量上对疾病发展作精确描述,较少受主观因素的影响,可利用计算机程序进行大量数据处理,因此在疾病预测中应用较为广泛。

2.1回归预测法

回归预测法是分析疾病与致病因子之间的联系,建立回归

方程式(回归模型),再根据回归模型对疾病的变化作出预测的研究方法。根据考虑致病因子的多少、疾病与致病因子的关系可分为一元线性回归预测法、多元线性回归线性预测法和非线性回归预测法。利用回归分析预测疾病在医学统计中应用广泛且技术较成熟,能够综合考虑多种因素的共同作用,但模型误差较大、外推性差,要的数据量大,并且对样本的分布有较高的要求。

2.2时间序列预测法

所谓时间序列预测法,就是把预测对象的历史数据按一定

的时间间隔进行排列,构成一个随时间变化的统计序列,建立相应的数据随时间变化的变化模型,并将该模型外推到未来进行预测。美国统计学家Ceogre E.P.Box 和英国统计学家Gwil -

vm M.Jenkins 提出的博克斯一詹金斯法(简称B-J 法或ARMA

模型法)是时间序列建模中最重要和最常用的预测手段。AR -

MA 模型法要求作为预测对象的时间序列必须是平稳序列,而

很多医学现象随着时间的推移都表现出上升或下降趋势,构成非平稳的时间序列,所以运用d 阶齐次非平稳时序的求和自回归滑动平均模型(ARMIA 模型):Φ(B )

·(1-B )d X t =Θ(B )αt ,因多数医学卫生现象都不平稳,故ARMIA 模型较为常用。

2.3马尔柯夫(Markov )预测法

马尔柯夫预测是将整个时间序列划分成若干状态,根据状

态之间的转移概率预测事物可能的状态区间,它是一种区间预测,最后预测的是实际值出现的范围。Markov 链是一个随机事件序列,是状态和时间都离散的Markov 过程,它具有无后效性(也就是说某事件的将来是什么状态,其概率有多大,只取决于事物现在所处的状态如何,而与以前的状态无关),主要研究状态之间的转移概率。比如在t 时刻某疾病处于状态s ,则在t +1时刻它将以概率p 处于状态S k ,p 即为状态S j 转移到S k 的转移概率,假设经过i 步转移,则转移概率记为P (i )

jk ,进而得到步状态转移概率矩阵为P (i )

=P (i )

jk

i ,j-1,…,n

。可以看出状态转移概率矩

阵反映了疾病由某种状态转移到各种状态的可能性大小,可以通过它来预测疾病的未来变化。臧春鹏根据徐州市1983~1997年伤寒发病数据,将伤寒的发病率划分为若干状态,计算各状

态间的转移次数,确定转移概率矩阵,根据矩阵中最大转移概率作出预报,1998年的预测结果与实际完全吻合。

2.4灰色系统预测法

灰色系统理论是我国著名学者邓聚龙教授1982年创立的

一门新兴学科,通过对原始数据的处理和灰色模型的建立,发现、掌握疾病的发展规律,对疾病的未来发展作出科学的定量预测。

和传统的预测方法相比,灰色预测只需要较少的几个数据就可建立模型进行预测,对于时间短、数据资料少、波动性不大的预测问题,预测精度较高。它目前最常用的预测模型为GM (1,1),它表示一个变量的一阶微分方程,只研究时间这个综合灰色量对某种疾病的作用,常用来推断疾病在将来的某一时刻或某几个时刻的发病率或死亡率。关志强等将灰色预测应用在健康数据预测上,把个人体检中血压的历史数据作为样本点,经过模型计算预测出未来一段时间的身体指标,对个体疾病预防起到一定的作用。石长胜等应用GM (1,1)模型对泰安市病毒性肝炎1971~1996年发病资料进行了拟合分析,对灾变(流行)可能发生的时间作出预测。GM (1,1)模型简单,对致病的影响因素基本不考虑,样本量少,这些特点也同样导致预测的粗糙性,对疾病的流行趋势只能做近期预测,适合指数增长的预测,对随机性、波动性较大的数据拟合预测结果较差。而GM (1,N )模型是分析模型、因子模型,表示N 个变量的一阶微分方程,它不具有全信息,一般不适合于多因素预测。

2.5人工神经网络预测法

人工神经网络(Artificial Neural Network ,ANN ),一种模仿动

物神经网络行为特征,进行分布式并行信息处理的算法数学模型。它是在对人脑神经网络的基本认识的基础上,从信息处理的角度用数理方法对人脑进行抽象,并建立某种简化模型。人工神经网络具有非线性容错性和自组织自学习自推理的自适应能力,能够通过对样本的学习训练,不断改变网络的连接权以及拓扑结构,以使网络的输出不断地接近期望的输出。它不需要分析相关因素的具体关系,通过一定样本的学习训练就能够自己总结出复杂的内在规律,从而进行疾病预测。

BP 神经网络是目前应用最为广泛的一种多层前馈网络,

在流行病学中,可以运用BP 网络建立疾病的预测模型。首先收集导致疾病发生的主要影响因素及疾病发生的结果;将影响因素及疾病结果输入到设计好的神经网络模型中进行反复训练,直到达到预期的训练误差;最后用建立好的模型进行疾病预测。王俊杰等筛选出影响精神分裂症发病的10个主要因素,并赋初值,将精神病新发病例和对照组输入设计好的BP 神经网络进行训练,最后再将测试组输入系统进行测试,预测的一致率为87.5%,前瞻性考核的效果较好。侯木舟等利用BP 神经网络法,得出预测数据的脑电地形图,将其与正常的脑电地形图进行比较,对大脑的病理状态进行分析,为脑疾病如癫痫病的诊断、预测和治疗提供依据。可见,BP 神经网络是一种非传统的多元非线性模型,可以识别变量间复杂的非线性关系,功能十分强大,而且无论变量是何种类型,是否满足正态性、独立性等条件均可用BP 网络建模。而BP 神经网络的设计直接关

·110·

表1

特点

回归预测法

软件导刊

定量预测法的比较

不足

当受随机扰动等错综因素影响时,误差较大,外推性差

2009年

适用范围适合中长期预测

能考虑疾病的各影响因素及相关关系;但要求样本量大且有较好的分布规律

时间序列预测法

不用考虑各影响因素,用时间变量来综合代表各影响因不能充分利用疾病影响因素间的相关关系;当遇到波素,简单易行易掌握;但要求样本序列平稳,波动性不大是区间预测,得到的结果是一个可能的区间,预测的准确度高;特别适用于波动性大的资料

是一种时间序列预测法,适合样本少、信息不全,且指数增长的预测

具有非线性容错性、自学习、自组织与自适应性,是一种

动性大的数据预测效果差

由于是区间预测,必然导致预测的精确度不高

短期预测精度较高

马尔柯夫预测法短期预测精度高

灰色系统预测法对随机性、波动性较大的数据拟合预测结果较差

人工神经网络法变结构模型,可以通过对样本的学习而不断地改变自身网络结构确定困难;算法复杂,容易陷入局部极小点

的数据结构,从而适应样本的变化

系到网络的应用效果,在应用时按照资料的特点从每一细节考虑网络的设计。

病的未来流行趋势,主要预测疾病的发病率、死亡率以及流行病的爆发点,对传染病的防制和各项卫生政策的制定起到重要的作用。在个体的疾病诊断预测方面,BP 神经网络模型应用较多,因为疾病的发病过程本是一个受多因素影响的复杂过程(例如遗传因素、生活方式、健康干预等等),传统的统计方法预测疾病的发生过程往往存在很大的局限性,而BP 神经网络的优点恰恰适合预测疾病的发生过程。因此今后可以尝试建立多种BP 神经网络模型对相应的疾病进行患病风险的预测,使得疾病能够早发现早诊治,提高早期的治愈率。

参考文献:[1][2][3][4][5][6][7][8][9][10][11][12]

徐国祥. 统计预测和决策[M ]. 上海:复旦大学出版社,1994. 吕晓燕,郭建军,李祥生. 一种基于模糊聚类分析的疾病电脑预测诊断方法[J ]. 电脑开发与应用,2003(12).

谭莘,田考聪. 数学模型在人群疾病预测研究中的应用[J ]. 中国医院统计,2005(1).

施仁杰. 马尔科夫链基础及其应用[M ]. 西安:西安电子科技大学出版社,1992.

江之源. 经济预测方法与模型[M ]. 成都:西南财经大学出版社,

3几种定量预测法的比较分析

定量预测的几种方法是疾病预测中常用到的方法,它们有

各自的特点,有的方法在短中期预测中精度较高,有的方法在长期预测中较有优势;有的对平稳数据较适用,有的却特别适用于有波动性改变的资料。表1分别列出了几种预测方法的特点和不足,便于进一步比较分析各种方法的优势和适用范围。

从表1中,我们可以看到各种预测方法在研究的角度、运用的数据形式、数据样本大小以及适用条件等方面都有所不同。从适用条件看,回归预测法适用于大样本且前后发展模式不变的预测;灰色模型预测法是通过对原始数据的整理来寻求规律,它适用于少信息或信息不明条件下的分析和预测。从数据的形式看,灰色系统理论是采用生成数据建模;回归分析法是采用原始数据建模;而马尔柯夫法是通过计算转移概率来预测未来值区间。从数据的特点看,时间序列法、灰色模型预测法、回归预测法要求数据平稳、波动性小;马尔柯夫预测法则适合于波动性较大的数据。从适用的时间分类看,时间序列、马尔柯夫、灰色模型法较适宜近期预测,对中长期预测,采用回归预测法。而神经网络法不受这些因素的限制,它是一种变结构模型,可以通过对样本的学习而不断地改变自身的数据结构,从而适应样本的变化,但是它的网络结构很难确定,算法比较复杂,对预测人员的思维科学、人工智能、计算机科学等多学科的知识要求很高,对于一般预测人员,模型的建立存在一定的困难。

由于每种单一的预测方法总有缺陷,1969年Bates 和

1999.

臧春鹏.Markov 模型在伤寒发病趋势预测中的应用[J ]. 江苏预防医学,1999(4).

邓聚龙. 灰色理论基础[M ]. 武汉:华中科技大学出版社,2002. 关志强,陈谊. 灰色模型在健康数据预测中的应用[J ]. 北京工商大学学报,2008.

石长胜,张振民. 灰色系统模型在病毒性肝炎暴发流行预测中的应用[J ]. 疾病监测,1997(12).

韩力群. 人工神经网络理论、设计与应用[M ]. 北京:化学工业出版社,2007.

王俊杰,陈景武.BP 神经网络在疾病预测中的应用[J ]. 数理医药学杂志,2008(3).

侯木舟,韩旭里,黄献.BP 神经网络在脑电图信号预测中的应用[J ]. 计算机工程与设计,2006(14).

(责任编辑:卓

光)

Granger 首次提出组合预测方法,它将不同的预测方法按一定

的方式综合,充分发挥各预测方法的优势,相互弥补不足,以求更佳的预测效果。尽管组合预测能够扬长避短,但理论还不够完善,目前它的发展仍处于不够成熟阶段。

4结束语

目前,疾病预测的前4种方法着重于研究整个人群某种疾


相关内容

  • 一类含有潜伏期的传染病动力学模型
  • 数理医药学杂志 文章编号#$%%&'&(()*+%%+,%-'%(.-'%+ 中图分类号#/($$ 文献标识码#0 +%%+年第$-卷第-期 一类含有潜伏期的传染病动力学模型! 张双德 摘 郝海张喜红 天津(%%$1+, 武警医学院基础部数学教研室* 要#在不考虑人群具有迁移和人群具 ...

  • 埃博拉病毒传播的数学模型
  • 数 学 建 模 论 文 基于传染病模型的埃博拉疫情发展建模分析 院系名称: 地球科学学院 专业名称: 环境科学 学生姓名:崔昊天.牛星智.朱家佑 学 号: 崔昊天:2013010176 指导教师: 孟得新 完成日期2015 年 4 月 29 日 论文的分工说明: 本篇数学建模论文,是在朱家佑.崔昊天 ...

  • 医疗专家系统方法
  • 医生一般是 ①通过询问病史.体格检查.实验室检查和辅助检查手段搜集临床资料:②整理.分析.评价资料:③提出诊断:④给出治疗处理. 医学专家系统的推理方法: 1. 基于规则推理 基于规则的推理是从领域专家那获取问题求解的知识,概括.转化为易于被计算机表示和推理的形式,然后以知识库中已有知识构成的规则为 ...

  • 第二节 生物信息学及其发展历史
  • 第二节 生物信息学及其发展历史 1, 生物信息学的概念 生物信息学(Bioinformatics) 这一名词的来由 八十年代末期, 林华安博士认识到将计算机科学与生物学结合起来的重要意义, 开始留意要为这一领域构思一个合适的名称. 起初, 考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学 ...

  • 三.数学与生物科学
  • (二)数学与生物科学 在生物方面的动物捕食,我们可以利用数学模型建立捕食和被捕食间的竞争模型,就是数学在生物学方面的应用. 1. 生物数学和DNA 生物学家告诉人们说,一个生物的全基因组序列蕴藏着这一生物的起源.进化.发育等所有与遗传性状有关的信息.所有这些重要信息都写在由4种碱基(A.T .G . ...

  • [核心知识]蛋白质折叠的热力学和动力学
  • 蛋白质折叠的热力学和动力学 药学院 10489629 苟宝迪 蛋白质是一种生物大分子,基本上是由20种氨基酸以肽键连接成肽链.肽链在空间卷曲折叠成为特定的三维空间结构.有的蛋白质由多条肽链组成,每条肽链称为亚基,亚基之间又有特定的空间关系,称为蛋白质的四级结构.所以蛋白质分子有非常特定的复杂的空间结 ...

  • (2011-0025)治安预测方法与技术比较研究2
  • 治安预测方法与技术比较研究 王 欣 (中国人民公安大学图书馆, 北京 102600) 摘要:治安预测是犯罪情报分析中重要的情报分析方法,是警方的日常警务工作中经常使用的工具,本文对国内外治安情报预测方法进行了广泛的研究,分析并总结了目前治安预测主要的技术和方法,比较了国外内治安预测研究的不同点,展望 ...

  • 大数据背景下医学数据挖掘的研究进展及应用_秦文哲
  • 中国胸心血管外科临床杂志 2016年1月第23卷第1期 Chin J Clin Thorac Cardiovasc Surg, January 2016, Vol. 23, No. 1 • 55 • 综 述 大数据背景下医学数据挖掘的研究进展及应用 秦文哲1 综述,陈进1,董力2 审校 1. 四川大 ...

  • 生物信息学发展概况及研究进展
  • 生物信息学发展概况及研究进展 韩龙 生物化学与分子生物学 2010200531 1 概述 生物信息学是在生命科学.计算机科学和数学的 基础上逐步发展而形成的一门新兴的边缘学科,它 以核酸和蛋白质为主要研究对象,以数学.计算机科 学为主要研究手段,对生物学实验数据进行获取.加 工.存储.检索与分析,从 ...