广义Poisson回归模型及其应用_张颖

·130·

中国卫生统计2000年6月第17卷第3期广义Poisson回归模型及其应用*

张 颖1 倪宗瓒1 姚树祥2 姜 勇2 巫秀美1

  【提 要】 目的 探讨广义Poisson回归模型在流行病学队列资料分析中的应用与价值。方法 拟合超额相对危险

度模型,绝对超额危险度模型,非标准模型等分析云锡现场队列研究资料。结果 在云锡肺癌现场,每一个观察人年每一工作水平月的氡子体暴露,会产生1.09×10-5个肺癌超额病例。在总的336例病例中,归因于氡子体暴露的有123例。只有当氡子体累积暴露高于588.37WLM时,暴露人群患肺癌危险性才高于基线对照。结论 广义Poisson回归模型的拟合可以得到对于危险因素的更深入描述,如计算出每一单位危险因素变化时,可得超额相对危险度的变化、以及由危险因素所引起超额病例数、超额绝对危险(EAR)、归因危险比(AR)以及超额发病率等。

【关键词】 广义Poisson回归模型 绝对超额危险度模型 超额相对危险度模型 氡子体累积暴露剂量

  Poisson回归模型主要用于队列研究资料的分析,鉴于它调整协变量的强大能力,常用以研究多因素对疾病的影响以及暴露与疾病间的剂量反应关系,尤其适用于影响肿瘤发病和死亡的危险因素研究。最常见

的Poisson回归模型是相加模型和相乘模型。但危险因素和疾病的关系是复杂的,需要有更适宜的模型加以描述。因此,本研究试图将广义Poisson回归模型引入肺癌危险因素分析,更为全面地分析疾病和危险因素之间的关系。现以氡子体和肺癌之间的关系为例说明广义Poisson回归模型的应用。

资料与方法

资料来源于1992~1996年与美国NCI合作,在云南锡业公司现场所建立的肺癌高危人群回顾性前瞻队列,共有8412个观察对象。

(一)常用的Poisson回归模型有以下两种(1)相加模型(又称超额危险度模型)

设队列人群有k个暴露组(如k个放射性氡子体暴露组),j个协变量层(如j个年龄组)。如果k水平暴露的效应只是在参照组(k=1)的个体的年龄专率λj1的效应上加了一个常数βk,模型为

λjk=αj+βk

在此,αβ1=0)为数据的待估参数。j=λj1,βk(

(2)相乘模型(又称相对危险度模型)

当原始测量数据不支持相加模型时,可以对率进行某种转换,一般用对数转换,则第j层(j=1,…,J),第k暴露组(k=2,…,K)的估计相对危险度为rjk/rj1,模型为:

    λjk=λjΧk

〔1,2〕

λjk表示发病率rjk的期望值函数,λj表示参照组第j层的发病率,Χk>1,当k=1,Χ1)k表示第k组(k=总的相对危险度。

该模型就是乘积模型(Productmodel)。为了计算的方便,可将乘积模型再参数化为对数线性模型,

即:

λα  (k=2,…,K)jk=exp(j+βk)

其中αj表示参照组层别发病率的自然对数,βk表示第k组相对危险度(与基线水平相比,Χ1)的自然对1=数。

(二)广义Possion回归模型〔1,3〕:

实际上,从线性模型的角度出发,任何一个应变量是分类变量的回归模型都可表示为下面简单的形式:

logRi=β′Zi  这里,Zi是自变量的矩阵,β是模型要估计的参

数,Ri根据不同的统计模型意义亦不同,如:在条件logistic回归模型中,为病例和对照的比数比;在Cox比例风险模型中,是相对危险度或相对危险比;在分组生存资料的Poisson回归中,是Poisson均值或一个分段常数危险函数。

可以用更为简单的模型描述:

Ri=f(β,Zi)

  若要估计分层混杂因素的效应,则采用模型:Ri=αi)f(β,Zi)s(  αi)用以表示混杂因素的效应,f表示函数关s(系,该函数可以是相加的,也可以是相乘的,可以是线性的函数,也可以是非线性的函数,或者是界于相加和相乘或线性和非线性之间的函数关系。

广义Poisson回归模型的形式很多,常见的有以下

:

*国家自然科学基金资助项目,(项目编号39770662)1.华西医科大学卫生统计教研室(成都610041)2.云南锡业公司劳动防护研究所(个旧661000)

ChineseJournalofHealthStatistics,June2000,Vol.17,No.3·131·

几种(模型的参数估计均可通过最大似然估计获得):

(1)普通对数线性模型或称作指数相对危险度模型(ExponentialRelativeRiskModel,ERR),模型公式为:

+βz

λ(t,z)=eα

  z为一组危险因素的矩阵,α为基线风险函数(发

ER/WLM。

在线性ERR模型和ER模型中可选择一个de-viance相对较小的模型。

(5)非标准模型(NonstandardModels)

除了拟合以上模型,还可对数据拟合如下模型:

z

λ(t,z)=θ1+β2Rn)eβ′s(

病密度)的对数,β为一组危险因素风险函数之比(相对危险度)的对数值。

(2)超额相对危险度模型或称相加相对危险度模型(ExcessRelativeRiskModel或AdditiveModelforRelativeRisk)

分析放射性暴露危险因素,在国际上常采用相加相对危险度模型,现假设放射性氡子体(Rn)的相对危险度是线性的或是二次项的。形式如下:

λ(t,z,Rn)=λ(t,z,0)(1+βRn)  其中,λ(t,z,0)为基线风险函数,β为当氡子体浓度每改变一个单位时超额危险度ERR的改变量,在

评价氡子体危险性时单位为(ERR/WLM),ERR=RR-1。暴露剂量的单位为“WLM”,即工作水平月。在该模型中,由于将危险因素的相对危险度和其他危险因素的相对危险度分开表达,故可以更直观地考察危险因素的相对危险度。

该模型的后半部又可表示为:RR=(1+βRn)

它实际上反映了氡子体和肺癌危险性的暴露-反应关系。据此,可以得到确切的氡子体致肺癌危险性的定量描述。

(3)危险因素引起的超额病例数和超额绝对危险(ExcessiveAbsoluteRisk,EAR)以及归因危险比(AR)的计算〔4〕。

通过以上拟合的ERR模型,可得到在整个随访中每单位Rn所导致的超额发病率和可以归因于放射性氡子体暴露的病例占总病例的比例。

拟合病例数=Piθs(i)(1+β1dosei)背景病例数=Piθs(i)

超额病例数=Piθs(i)β1dosei

Pi是i格中的人年数,s(i)是这格中的分层指标,这对于定量评价危险因素的效应很有价值。

(4)绝对超额危险度模型(AbsoluteExcessRiskModel)

绝对超额危险度模型是相对危险度模型的替代物。在一个超额危险模型中,暴露的效应表示为g(z,w),加上基础肺癌死亡率,即:

λ(x,z,w)=λx)+g(z,w)0(

  此处线性的暴露反应模型的模式是

λ(x,w)=λ0(x)+βw

,危险因素氡子体(WLM)

β′z=β3x3+β4x4+β5x5

x3,x4,x5分别为一些危险因素,如慢支炎,读书年限,首次下坑年龄等。

结果与分析

本研究以评价氡子体等的肺癌危险性为例,将初步筛选出的以下10个变量:是否患哮喘、是否患慢支炎、进入队列时年龄、厨房位置、氡子体累积暴露剂量、

是否念过书、砷累积暴露剂量、首次下坑年龄、粉尘累积暴露剂量、吸烟指数拟合广义Poisson回归模型。为表达简洁,现列出几个危险因素的等级划分(表1)。

表1 危险因素暴露剂量范围

暴 露 等 级

10~0~0~

21.88~15~1.25~

1~

3200.42~

19~3~

4

23~

5

332.17~588.37~

首次下坑年龄(岁)受教育年限(年)

吸烟指数(g/天×年)0~302.68~536.385~808.08~

  (一)对数线性模型结果:

表2 对数线性模型的拟合结果

变量名常数项氡子体2氡子体3氡子体4氡子体5

回归系数-0.25770.40700.82230.89511.1880

0.57630.50820.50990.5126

0.480

0.4855~4.64900.8405~6.16100.9010~6.64901.2010~8.9610

标准误

P值

95%CI

  可以看出,只有氡子体浓度达到第五个剂量水平,暴露人群患肺癌的危险性与基线对照人群相比,差别才有统计学意义。

表3 其他危险因素的危险性分析结果

变量名

回归系数

标准误0.14790.17410.16730.11020.15330.1284

P值0.268>0.5000.020

95%CI0.6354~1.13400.6673~1.32000.5209~1.01000.4794~0.73830.6474~1.18100.4797~0.7936

首次下坑年龄2-0.1638首次下坑年龄3-0.0633首次下坑年龄4-0.4986是否患过慢支读书年限2读书年限3

-0.5193-0.1343-0.4828

2  Deviance=1368.54 自由度=3735 Pearsonχ=7147.15

  从结果可看出,大剂量的氡子体暴露、患过慢支炎是云锡矿工肺癌的危险因素,而读书年限3级以上则是保护性因素。  (二)超额相对危险度模型结果

·132·

表4 超额相对危险度模型的拟合结果

变 量 名对数线性项常数项读书2读书3(x1)慢支炎(x2)首次下坑年龄线性项

氡子体(WLM)

0.0009550

0.036

0.64E-04~

0.18E-02

0.5708-0.1490-0.4709-0.5262-0.02836

0.334

0.6368~1.16600.4840~0.80570.4750~0.73500.9479~0.9968

β值

P

95%CI

变量名

对数线性项0常数项线性项1WLM对数线性项1读书2(x1)读书3(x2)慢支炎(x3)

中国卫生统计2000年6月第17卷第3期表6 非标准模型的拟合结果

β-0.9143

0.00076

0.00018~0.123.65~10.401.82~6.320.29~0.74

P

95%CI

2=6700.  Deviance=1263.42 自由度=3128 Pearsonχ462

  Deviance=1262.45 df=3135 Pearsonχ=5627.11

  代入数据模型可写为:

4709x1-0.5262x2-0.02836x3

λ(t,z,Rn)=e-0.(1+

模型可以写作:

123λ(t,Z)=e(1+0.00076Rn)e

模型拟合效果和对数线性模型拟合结果相似,但

-0.914.201x+3.849x-0.75x

0.00095Rn)

氡子体的相对危险度可表示为:RR=(1+

0.00095Rn)

这里ERR=0.00095/WLM,即氡子体累积暴露剂量每增加一个单位,ERR增加0.095%。从本模型可见慢支炎、首次下坑年龄小、大剂量的氡子体暴露是云锡矿工肺癌的危险因素,而读书多于三年是矿工肺癌的保护因素。

(三)由危险因素引起的超额病例数和EAR以及AR的计算结果:

总病例数为336例,归因于氡子体暴露的有123例,其中,氡子体各层暴露所占的数目以及AR(即在总的病例数中由氡子体放射性照射所引起的病例数所占的比例)见表5。

表5 超额病例数及归因危险比的计算结果

层数(WLM)第一层(0)

第二层(1.88~200.41)第三层(200.41~332.17)第四层(332.17~588.37)第五层(≥588.37)

病例数4192881

构成(%)3.250.817.3222.7665.85

AR%12.857.3418.4428.6149.30

它可以对危险因素的效应进行线性表达。

讨  论

1.通过以上分析发现,广义Poisson回归模型在危险因素分析中具有广泛的应用前景。它能运算大规模的队列研究数据,为队列资料的分析提供了更多手段。通过分析不但证实了过去的结论

〔6〕

,而且还得到

了一些过去的分析所未能得到的结果。如,在总的

336例病例中,归因于氡子体暴露产生的病例数为123例;在每一个观察人年每一个工作水平月的氡子体暴露下,会产生1.09×10-5个超额肺癌病例。最为重要的是,通过本次分析发现,并不是只要有氡子体暴露者患肺癌的危险性与基线对照比就有差别,而是只有当氡子体浓度高于一定的界值(高于588.37WLM时),暴露人群患肺癌危险性才高于基线对照。这对制定防治策略非常重要。

2.在过去对于Poisson回归模型的探讨中,应用的最多的是对数线性模型。而在实际研究中,并非所有资料都符合对数线性模型,有的可能符合类线性或固有非线性模型,有的模型形式可能更复杂。只有根据数据特点,采用合适的模型,才能真正揭示疾病和危险因素之间的关系,而广义Poisson回归模型能够较好地满足上述要求。

3.在广义Poisson回归模型的各种模型中,超额相对危险度模型还可以提供当危险因素累积暴露剂量每增加一个单位,相对危险度的增加量,同时还可计算危险因素引起的超额病例数和超额绝对危险以及归因危险度,这对于危险因素的定量分析提供了更切实的依据。

4.通过分析还发现,在慢性病的危险因素分析中,随着年龄的增长,疾病的发病率呈指数上升,用相乘模型描述疾病和危险因素之间的关系优于相加模型。

  EAR=1.09×10-5/WLM·人年,即在每一个观察人年每一个工作水平月的氡子体暴露下,会产生1.09×10-5个超额肺癌病例。

(四)绝对超额危险度模型结果

为寻找最佳模型,还对数据拟合了绝对超额危险度模型。但是在拟合模型时发现,无论怎样组合变量

进入模型,模型都具有较大的deviance值并且氡子体变得与肺癌发生毫无关系。说明用绝对超额危险模型表达氡子体和肺癌之间的联系不够准确。这与Dr.Lubin的分析一致:“在分析中(对氡子体致肺癌的危险性分析),相对危险模型一般比超额危险模型的de-viance更小……。”

(五)非标准模型

〔5〕

ChineseJournalofHealthStatistics,June2000,Vol.17,No.3·133·

siverelativeriskmodel Absolutiveexcessiveriskmodel The

GeneralizedPoissonRegressionanditsApplication ZhangYing,NiZongzan,YaoShuxiang,etal.,WestChinaUniversityofMedicalScience(610041).Chengdu.

radondaughterexposuredose

参 考 文 献

1.李克,俞顺章.Poisson模型与队列研究———原理与应用.中国卫生统

  【Abstract】 Objective ToexploretheapplicabilityofgeneralizedpoissionregressioninEpidemiologiccohortdata.Methods FittingExces-siveRelativeRiskModels,AbsolutiveExcessiveRiskModel,andsoontotheYTCcohortdata.Results Itisfoundthattherewouldbe1.09×10-5excessivelungcancercasesfor1WLMforonepersonyear.Thelungcancerof123cohortsubjectsamongallofthe336patientscouldbeat-tributedtotheradondaughterexposuredoseofradondaughtermorethan588.73WLMwouldhavethehigherriskoflungcancer,whilecomparedwiththebaselinecontrol.Conclusion Theapplicationofgeneralizedpois-sonregressioncouldreachdeeperimpressionaboutriskfactorsofinterest.Forexample,thechangeofexcessiverelativerisk,thecalculationofexces-sivecases,andtheestimationofAttributableRiskRationforthechangeofoneunitofexposurecouldbeconductedunderthepoissonregerssionmod-els.

计,1997,14(1):46.

2.宇传华,余松林,Poisson回归在职业队列研究中的应用.中国卫生统计,1996,13(1):6.

3.PrestonD.L.,Lubin,J.H.,andPierce,D.A.EPICURE:RiskRegres-sionandDataAnalysisSoftware.Seattle,Washington:HirosoftInterna-tionalCooperation,1993.

4.BreslowNE,DayNE.Statisticalmethodsincancerresearch.Vol.Ⅱ.Thedesignandanalysisofcohortstudies.Lyon:LARC,1987.

5.ShuXiangYao,JayH.Lubin,You-linQiao,etal.ExposuretoRadonProgeny,TobaccoUseandLungCancerinaCase-ControlStudyinSouthernChina.RadiationResearch,1994,(138):326.

6.JayH.Lubinetal.RadonandLungCancerRisk:AJointAnalysisof11UndergroundMinersStudies.U.S.DepartmentofHealthandHumanServices,PublicHealthService,NIH.1994.

【Keywords】 Generalizedpoissonregressionmodels Exces-

医院实现网络化管理后统计工作的特点与体会

兰州军区乌鲁木齐总医院信息科(830000)解放军第十五医院新疆军区联勤部门诊部

严金燕

 扬 超严红艳

  随着医院信息管理网络化的实现,我院于1997年下半年

引进了《军卫一号工程》软件,在全院实现了计算机联网。在一年多的运行实践中,收到了良好的经济效益和管理效益,现就计算机管理运行过程中统计工作的特点和体会介绍如下:

1.原有统计工作中存在的弊端

过去运行的《医院信息管理》软件是建立在单用户基础上的,运行中存在着原始统计数据收集方法落后、大量数据转抄、转录次数多、手续繁琐、速度慢等问题。加之医务人员对统计数据重要性认识不够,常常出现数据不准确的现象,给管理部门提供了错误信息。

2.实现网络化管理的特点

针对原有统计工作中存在的弊端,我院引进的全军信息系统《军卫一号工程》软件,是集门诊、住院、收费、病案、统计、查询等为一体的管理型软件。它形成了病人就医全过程的计算机管理,病人信息由各部门分类输入,减少了数据转抄、转录等中间环节过多而造成的人为误差,提高了统计数据的准确性。

系统在各科室计算机病人信息库管理的基础上,可任意对全部或部分信息进行查询,实现了住院病人的住院时查询和出院后查询。管理者可通过网络对全院病人情况随时进行了解,对每份病案记录、医嘱、护理等情况进行监控,实现了计算机查房。数据信息随时提取,且种类齐全,实现了全院信息共享,满足了医院当前应用和未来一段时间发展的需要。

3.统计管理网络化运行的体会

系统一年多的运行证明,它功能全、速度快、效率高、省时省力,具有良好的灵活性和实用性。它把统计人员从繁杂的统计工作中解脱出来,为医院领导决策提供了全面、客观、现实的数据。系统对所有的统计数据、表格、图表进行自动分类存储,为医院保存了宝贵的第一手统计资料,为医护人员提供各类医、教、研所需的各类数据信息,满足了当前统计数据需求量大、内容复杂、准确度高的要求。医院实行网络化管理后,要求网上各个工作环节必须密切配合,认真负责,相互协调,把联网后统计工作的及时性和准确性真正体现出来,切实做好联网后的医院统计工作,使医院网络管理充分发挥作用。

·130·

中国卫生统计2000年6月第17卷第3期广义Poisson回归模型及其应用*

张 颖1 倪宗瓒1 姚树祥2 姜 勇2 巫秀美1

  【提 要】 目的 探讨广义Poisson回归模型在流行病学队列资料分析中的应用与价值。方法 拟合超额相对危险

度模型,绝对超额危险度模型,非标准模型等分析云锡现场队列研究资料。结果 在云锡肺癌现场,每一个观察人年每一工作水平月的氡子体暴露,会产生1.09×10-5个肺癌超额病例。在总的336例病例中,归因于氡子体暴露的有123例。只有当氡子体累积暴露高于588.37WLM时,暴露人群患肺癌危险性才高于基线对照。结论 广义Poisson回归模型的拟合可以得到对于危险因素的更深入描述,如计算出每一单位危险因素变化时,可得超额相对危险度的变化、以及由危险因素所引起超额病例数、超额绝对危险(EAR)、归因危险比(AR)以及超额发病率等。

【关键词】 广义Poisson回归模型 绝对超额危险度模型 超额相对危险度模型 氡子体累积暴露剂量

  Poisson回归模型主要用于队列研究资料的分析,鉴于它调整协变量的强大能力,常用以研究多因素对疾病的影响以及暴露与疾病间的剂量反应关系,尤其适用于影响肿瘤发病和死亡的危险因素研究。最常见

的Poisson回归模型是相加模型和相乘模型。但危险因素和疾病的关系是复杂的,需要有更适宜的模型加以描述。因此,本研究试图将广义Poisson回归模型引入肺癌危险因素分析,更为全面地分析疾病和危险因素之间的关系。现以氡子体和肺癌之间的关系为例说明广义Poisson回归模型的应用。

资料与方法

资料来源于1992~1996年与美国NCI合作,在云南锡业公司现场所建立的肺癌高危人群回顾性前瞻队列,共有8412个观察对象。

(一)常用的Poisson回归模型有以下两种(1)相加模型(又称超额危险度模型)

设队列人群有k个暴露组(如k个放射性氡子体暴露组),j个协变量层(如j个年龄组)。如果k水平暴露的效应只是在参照组(k=1)的个体的年龄专率λj1的效应上加了一个常数βk,模型为

λjk=αj+βk

在此,αβ1=0)为数据的待估参数。j=λj1,βk(

(2)相乘模型(又称相对危险度模型)

当原始测量数据不支持相加模型时,可以对率进行某种转换,一般用对数转换,则第j层(j=1,…,J),第k暴露组(k=2,…,K)的估计相对危险度为rjk/rj1,模型为:

    λjk=λjΧk

〔1,2〕

λjk表示发病率rjk的期望值函数,λj表示参照组第j层的发病率,Χk>1,当k=1,Χ1)k表示第k组(k=总的相对危险度。

该模型就是乘积模型(Productmodel)。为了计算的方便,可将乘积模型再参数化为对数线性模型,

即:

λα  (k=2,…,K)jk=exp(j+βk)

其中αj表示参照组层别发病率的自然对数,βk表示第k组相对危险度(与基线水平相比,Χ1)的自然对1=数。

(二)广义Possion回归模型〔1,3〕:

实际上,从线性模型的角度出发,任何一个应变量是分类变量的回归模型都可表示为下面简单的形式:

logRi=β′Zi  这里,Zi是自变量的矩阵,β是模型要估计的参

数,Ri根据不同的统计模型意义亦不同,如:在条件logistic回归模型中,为病例和对照的比数比;在Cox比例风险模型中,是相对危险度或相对危险比;在分组生存资料的Poisson回归中,是Poisson均值或一个分段常数危险函数。

可以用更为简单的模型描述:

Ri=f(β,Zi)

  若要估计分层混杂因素的效应,则采用模型:Ri=αi)f(β,Zi)s(  αi)用以表示混杂因素的效应,f表示函数关s(系,该函数可以是相加的,也可以是相乘的,可以是线性的函数,也可以是非线性的函数,或者是界于相加和相乘或线性和非线性之间的函数关系。

广义Poisson回归模型的形式很多,常见的有以下

:

*国家自然科学基金资助项目,(项目编号39770662)1.华西医科大学卫生统计教研室(成都610041)2.云南锡业公司劳动防护研究所(个旧661000)

ChineseJournalofHealthStatistics,June2000,Vol.17,No.3·131·

几种(模型的参数估计均可通过最大似然估计获得):

(1)普通对数线性模型或称作指数相对危险度模型(ExponentialRelativeRiskModel,ERR),模型公式为:

+βz

λ(t,z)=eα

  z为一组危险因素的矩阵,α为基线风险函数(发

ER/WLM。

在线性ERR模型和ER模型中可选择一个de-viance相对较小的模型。

(5)非标准模型(NonstandardModels)

除了拟合以上模型,还可对数据拟合如下模型:

z

λ(t,z)=θ1+β2Rn)eβ′s(

病密度)的对数,β为一组危险因素风险函数之比(相对危险度)的对数值。

(2)超额相对危险度模型或称相加相对危险度模型(ExcessRelativeRiskModel或AdditiveModelforRelativeRisk)

分析放射性暴露危险因素,在国际上常采用相加相对危险度模型,现假设放射性氡子体(Rn)的相对危险度是线性的或是二次项的。形式如下:

λ(t,z,Rn)=λ(t,z,0)(1+βRn)  其中,λ(t,z,0)为基线风险函数,β为当氡子体浓度每改变一个单位时超额危险度ERR的改变量,在

评价氡子体危险性时单位为(ERR/WLM),ERR=RR-1。暴露剂量的单位为“WLM”,即工作水平月。在该模型中,由于将危险因素的相对危险度和其他危险因素的相对危险度分开表达,故可以更直观地考察危险因素的相对危险度。

该模型的后半部又可表示为:RR=(1+βRn)

它实际上反映了氡子体和肺癌危险性的暴露-反应关系。据此,可以得到确切的氡子体致肺癌危险性的定量描述。

(3)危险因素引起的超额病例数和超额绝对危险(ExcessiveAbsoluteRisk,EAR)以及归因危险比(AR)的计算〔4〕。

通过以上拟合的ERR模型,可得到在整个随访中每单位Rn所导致的超额发病率和可以归因于放射性氡子体暴露的病例占总病例的比例。

拟合病例数=Piθs(i)(1+β1dosei)背景病例数=Piθs(i)

超额病例数=Piθs(i)β1dosei

Pi是i格中的人年数,s(i)是这格中的分层指标,这对于定量评价危险因素的效应很有价值。

(4)绝对超额危险度模型(AbsoluteExcessRiskModel)

绝对超额危险度模型是相对危险度模型的替代物。在一个超额危险模型中,暴露的效应表示为g(z,w),加上基础肺癌死亡率,即:

λ(x,z,w)=λx)+g(z,w)0(

  此处线性的暴露反应模型的模式是

λ(x,w)=λ0(x)+βw

,危险因素氡子体(WLM)

β′z=β3x3+β4x4+β5x5

x3,x4,x5分别为一些危险因素,如慢支炎,读书年限,首次下坑年龄等。

结果与分析

本研究以评价氡子体等的肺癌危险性为例,将初步筛选出的以下10个变量:是否患哮喘、是否患慢支炎、进入队列时年龄、厨房位置、氡子体累积暴露剂量、

是否念过书、砷累积暴露剂量、首次下坑年龄、粉尘累积暴露剂量、吸烟指数拟合广义Poisson回归模型。为表达简洁,现列出几个危险因素的等级划分(表1)。

表1 危险因素暴露剂量范围

暴 露 等 级

10~0~0~

21.88~15~1.25~

1~

3200.42~

19~3~

4

23~

5

332.17~588.37~

首次下坑年龄(岁)受教育年限(年)

吸烟指数(g/天×年)0~302.68~536.385~808.08~

  (一)对数线性模型结果:

表2 对数线性模型的拟合结果

变量名常数项氡子体2氡子体3氡子体4氡子体5

回归系数-0.25770.40700.82230.89511.1880

0.57630.50820.50990.5126

0.480

0.4855~4.64900.8405~6.16100.9010~6.64901.2010~8.9610

标准误

P值

95%CI

  可以看出,只有氡子体浓度达到第五个剂量水平,暴露人群患肺癌的危险性与基线对照人群相比,差别才有统计学意义。

表3 其他危险因素的危险性分析结果

变量名

回归系数

标准误0.14790.17410.16730.11020.15330.1284

P值0.268>0.5000.020

95%CI0.6354~1.13400.6673~1.32000.5209~1.01000.4794~0.73830.6474~1.18100.4797~0.7936

首次下坑年龄2-0.1638首次下坑年龄3-0.0633首次下坑年龄4-0.4986是否患过慢支读书年限2读书年限3

-0.5193-0.1343-0.4828

2  Deviance=1368.54 自由度=3735 Pearsonχ=7147.15

  从结果可看出,大剂量的氡子体暴露、患过慢支炎是云锡矿工肺癌的危险因素,而读书年限3级以上则是保护性因素。  (二)超额相对危险度模型结果

·132·

表4 超额相对危险度模型的拟合结果

变 量 名对数线性项常数项读书2读书3(x1)慢支炎(x2)首次下坑年龄线性项

氡子体(WLM)

0.0009550

0.036

0.64E-04~

0.18E-02

0.5708-0.1490-0.4709-0.5262-0.02836

0.334

0.6368~1.16600.4840~0.80570.4750~0.73500.9479~0.9968

β值

P

95%CI

变量名

对数线性项0常数项线性项1WLM对数线性项1读书2(x1)读书3(x2)慢支炎(x3)

中国卫生统计2000年6月第17卷第3期表6 非标准模型的拟合结果

β-0.9143

0.00076

0.00018~0.123.65~10.401.82~6.320.29~0.74

P

95%CI

2=6700.  Deviance=1263.42 自由度=3128 Pearsonχ462

  Deviance=1262.45 df=3135 Pearsonχ=5627.11

  代入数据模型可写为:

4709x1-0.5262x2-0.02836x3

λ(t,z,Rn)=e-0.(1+

模型可以写作:

123λ(t,Z)=e(1+0.00076Rn)e

模型拟合效果和对数线性模型拟合结果相似,但

-0.914.201x+3.849x-0.75x

0.00095Rn)

氡子体的相对危险度可表示为:RR=(1+

0.00095Rn)

这里ERR=0.00095/WLM,即氡子体累积暴露剂量每增加一个单位,ERR增加0.095%。从本模型可见慢支炎、首次下坑年龄小、大剂量的氡子体暴露是云锡矿工肺癌的危险因素,而读书多于三年是矿工肺癌的保护因素。

(三)由危险因素引起的超额病例数和EAR以及AR的计算结果:

总病例数为336例,归因于氡子体暴露的有123例,其中,氡子体各层暴露所占的数目以及AR(即在总的病例数中由氡子体放射性照射所引起的病例数所占的比例)见表5。

表5 超额病例数及归因危险比的计算结果

层数(WLM)第一层(0)

第二层(1.88~200.41)第三层(200.41~332.17)第四层(332.17~588.37)第五层(≥588.37)

病例数4192881

构成(%)3.250.817.3222.7665.85

AR%12.857.3418.4428.6149.30

它可以对危险因素的效应进行线性表达。

讨  论

1.通过以上分析发现,广义Poisson回归模型在危险因素分析中具有广泛的应用前景。它能运算大规模的队列研究数据,为队列资料的分析提供了更多手段。通过分析不但证实了过去的结论

〔6〕

,而且还得到

了一些过去的分析所未能得到的结果。如,在总的

336例病例中,归因于氡子体暴露产生的病例数为123例;在每一个观察人年每一个工作水平月的氡子体暴露下,会产生1.09×10-5个超额肺癌病例。最为重要的是,通过本次分析发现,并不是只要有氡子体暴露者患肺癌的危险性与基线对照比就有差别,而是只有当氡子体浓度高于一定的界值(高于588.37WLM时),暴露人群患肺癌危险性才高于基线对照。这对制定防治策略非常重要。

2.在过去对于Poisson回归模型的探讨中,应用的最多的是对数线性模型。而在实际研究中,并非所有资料都符合对数线性模型,有的可能符合类线性或固有非线性模型,有的模型形式可能更复杂。只有根据数据特点,采用合适的模型,才能真正揭示疾病和危险因素之间的关系,而广义Poisson回归模型能够较好地满足上述要求。

3.在广义Poisson回归模型的各种模型中,超额相对危险度模型还可以提供当危险因素累积暴露剂量每增加一个单位,相对危险度的增加量,同时还可计算危险因素引起的超额病例数和超额绝对危险以及归因危险度,这对于危险因素的定量分析提供了更切实的依据。

4.通过分析还发现,在慢性病的危险因素分析中,随着年龄的增长,疾病的发病率呈指数上升,用相乘模型描述疾病和危险因素之间的关系优于相加模型。

  EAR=1.09×10-5/WLM·人年,即在每一个观察人年每一个工作水平月的氡子体暴露下,会产生1.09×10-5个超额肺癌病例。

(四)绝对超额危险度模型结果

为寻找最佳模型,还对数据拟合了绝对超额危险度模型。但是在拟合模型时发现,无论怎样组合变量

进入模型,模型都具有较大的deviance值并且氡子体变得与肺癌发生毫无关系。说明用绝对超额危险模型表达氡子体和肺癌之间的联系不够准确。这与Dr.Lubin的分析一致:“在分析中(对氡子体致肺癌的危险性分析),相对危险模型一般比超额危险模型的de-viance更小……。”

(五)非标准模型

〔5〕

ChineseJournalofHealthStatistics,June2000,Vol.17,No.3·133·

siverelativeriskmodel Absolutiveexcessiveriskmodel The

GeneralizedPoissonRegressionanditsApplication ZhangYing,NiZongzan,YaoShuxiang,etal.,WestChinaUniversityofMedicalScience(610041).Chengdu.

radondaughterexposuredose

参 考 文 献

1.李克,俞顺章.Poisson模型与队列研究———原理与应用.中国卫生统

  【Abstract】 Objective ToexploretheapplicabilityofgeneralizedpoissionregressioninEpidemiologiccohortdata.Methods FittingExces-siveRelativeRiskModels,AbsolutiveExcessiveRiskModel,andsoontotheYTCcohortdata.Results Itisfoundthattherewouldbe1.09×10-5excessivelungcancercasesfor1WLMforonepersonyear.Thelungcancerof123cohortsubjectsamongallofthe336patientscouldbeat-tributedtotheradondaughterexposuredoseofradondaughtermorethan588.73WLMwouldhavethehigherriskoflungcancer,whilecomparedwiththebaselinecontrol.Conclusion Theapplicationofgeneralizedpois-sonregressioncouldreachdeeperimpressionaboutriskfactorsofinterest.Forexample,thechangeofexcessiverelativerisk,thecalculationofexces-sivecases,andtheestimationofAttributableRiskRationforthechangeofoneunitofexposurecouldbeconductedunderthepoissonregerssionmod-els.

计,1997,14(1):46.

2.宇传华,余松林,Poisson回归在职业队列研究中的应用.中国卫生统计,1996,13(1):6.

3.PrestonD.L.,Lubin,J.H.,andPierce,D.A.EPICURE:RiskRegres-sionandDataAnalysisSoftware.Seattle,Washington:HirosoftInterna-tionalCooperation,1993.

4.BreslowNE,DayNE.Statisticalmethodsincancerresearch.Vol.Ⅱ.Thedesignandanalysisofcohortstudies.Lyon:LARC,1987.

5.ShuXiangYao,JayH.Lubin,You-linQiao,etal.ExposuretoRadonProgeny,TobaccoUseandLungCancerinaCase-ControlStudyinSouthernChina.RadiationResearch,1994,(138):326.

6.JayH.Lubinetal.RadonandLungCancerRisk:AJointAnalysisof11UndergroundMinersStudies.U.S.DepartmentofHealthandHumanServices,PublicHealthService,NIH.1994.

【Keywords】 Generalizedpoissonregressionmodels Exces-

医院实现网络化管理后统计工作的特点与体会

兰州军区乌鲁木齐总医院信息科(830000)解放军第十五医院新疆军区联勤部门诊部

严金燕

 扬 超严红艳

  随着医院信息管理网络化的实现,我院于1997年下半年

引进了《军卫一号工程》软件,在全院实现了计算机联网。在一年多的运行实践中,收到了良好的经济效益和管理效益,现就计算机管理运行过程中统计工作的特点和体会介绍如下:

1.原有统计工作中存在的弊端

过去运行的《医院信息管理》软件是建立在单用户基础上的,运行中存在着原始统计数据收集方法落后、大量数据转抄、转录次数多、手续繁琐、速度慢等问题。加之医务人员对统计数据重要性认识不够,常常出现数据不准确的现象,给管理部门提供了错误信息。

2.实现网络化管理的特点

针对原有统计工作中存在的弊端,我院引进的全军信息系统《军卫一号工程》软件,是集门诊、住院、收费、病案、统计、查询等为一体的管理型软件。它形成了病人就医全过程的计算机管理,病人信息由各部门分类输入,减少了数据转抄、转录等中间环节过多而造成的人为误差,提高了统计数据的准确性。

系统在各科室计算机病人信息库管理的基础上,可任意对全部或部分信息进行查询,实现了住院病人的住院时查询和出院后查询。管理者可通过网络对全院病人情况随时进行了解,对每份病案记录、医嘱、护理等情况进行监控,实现了计算机查房。数据信息随时提取,且种类齐全,实现了全院信息共享,满足了医院当前应用和未来一段时间发展的需要。

3.统计管理网络化运行的体会

系统一年多的运行证明,它功能全、速度快、效率高、省时省力,具有良好的灵活性和实用性。它把统计人员从繁杂的统计工作中解脱出来,为医院领导决策提供了全面、客观、现实的数据。系统对所有的统计数据、表格、图表进行自动分类存储,为医院保存了宝贵的第一手统计资料,为医护人员提供各类医、教、研所需的各类数据信息,满足了当前统计数据需求量大、内容复杂、准确度高的要求。医院实行网络化管理后,要求网上各个工作环节必须密切配合,认真负责,相互协调,把联网后统计工作的及时性和准确性真正体现出来,切实做好联网后的医院统计工作,使医院网络管理充分发挥作用。


相关内容

  • 卫生统计学教学大纲
  • 卫生统计学教学大纲 (供预防医学专业五年制本科生使用) 前言 卫生统计学是研究居民健康状况以及卫生服务领域中数据的收集.整理和分析的一门科学.本课程的教学目的是为学生在校学习专业课程,毕业后从事公共卫生领域的研究和实际工作,打下必要的卫生统计学基础.在学习本课程时,应注意掌握卫生统计学的基本理论.基 ...

  • 随机过程.机器学习和蒙特卡洛在金融应用中都有哪些关系?
  • 提问者说的这些我都学过,并在硕士阶段攻读其中若干领域. \begin{article} ============Keywords============ 随机过程 stochastic processes 泊松过程 Poisson processes 更新过程 renewal processes 布 ...

  • 泊松回归在生育率研究中的应用
  • 泊松回归在生育率研究中的应用 郭志刚 巫锡炜* [摘 要] 泊松回归是专门分析因变量为计数变量的回归模型.文章通过对 2001年全国计划生育/生殖健康调查数据的泊松回归分析来介绍其在生育率研究中 的应用.泊松回归除了可以接受虚拟编码方式的年龄.城乡等常规人口学分类自变 量外, 还可以直接接受支出.收 ...

  • Logistic回归梯度下降法
  • Logistic回归学习材料 广义线性模型(generalizedlinear model) 这一家族中的模型形式基本上都差不多,不同的就是因变量不同.     如果是连续的,就是多元线性回归: 如果是二项分布,就是Logistic回归: 如果是Poisson分布,就是Poisson回归: ...

  • 应用随机过程试题及答案
  • 应用随机过程试题及答案 一.概念简答题(每题5 分,共40 分) 1. 写出卡尔曼滤波的算法公式 2. 写出ARMA (p,q )模型的定义 3. 简述Poisson 过程的随机分流定理 4. 简述Markov 链与Markov 性质的概念 5. 简述Markov 状态分解定理 6.简述HMM 要解 ...

  • 01基础知识:统计学(2013年度卫生管理专业职称考试)
  • 01基础知识:统计学(2013年度卫生管理专业职称考试). 第一至五章 统计学是研究数据及其存在规律的科学,是关于数据收集.整理.分析.表达和解释的普遍原理和方法. 统计学的总体是指根据研究目的确定的.全部同质个体的某个(或某些)变量值.这里的个体又称观察单位(或研究单位),可以是一个社区.一个特定 ...

  • 2卫生管理师职称考试之[统计学]知识点及试题
  • 卫生管理师职称考试之<统计学>知识点及试题 第一部分 基础知识 统计学 统计学是研究数据及其存在规律的科学,是关于数据收集.整理.分析.表达和解释的普遍原理和方法. 统计学的总体是指根据研究目的确定的.全部同质个体的某个(或某些)变量值.这里的个体又称观察单位(或研究单位),可以是一个社 ...

  • [孙振球第三版]医学统计学复习题(整理版)
  • 1.总体:根据研究目的确定的同质观察单位的全体.是同质所有(2)多分类:各类间互不相容.24.无序分类变量资料:计数资观察单位的某种变量值的集合.2.有限总体:是指空间.时间范料,又称定性资料.是将观察单位按照某种属性或类别分组计数,围限制的总体.3.无限总体:是指没有空间.时间限制的总体.分组汇总 ...

  • 人口年龄结构模型建模和预测
  • 上海交通大学 硕士学位论文 人口年龄结构模型建模和预测 姓名:虞丽萍 申请学位级别:硕士 专业:控制理论与控制工程 指导教师:袁景淇 20070101 人口年龄结构模型建模和预测 摘 要 人口是一个动态系统.人口变化对未来经济.社会的发展有着直接的影响.人口年龄结构是人口研究的重要指标之一,人口年龄 ...