·130·
中国卫生统计2000年6月第17卷第3期广义Poisson回归模型及其应用*
张 颖1 倪宗瓒1 姚树祥2 姜 勇2 巫秀美1
【提 要】 目的 探讨广义Poisson回归模型在流行病学队列资料分析中的应用与价值。方法 拟合超额相对危险
度模型,绝对超额危险度模型,非标准模型等分析云锡现场队列研究资料。结果 在云锡肺癌现场,每一个观察人年每一工作水平月的氡子体暴露,会产生1.09×10-5个肺癌超额病例。在总的336例病例中,归因于氡子体暴露的有123例。只有当氡子体累积暴露高于588.37WLM时,暴露人群患肺癌危险性才高于基线对照。结论 广义Poisson回归模型的拟合可以得到对于危险因素的更深入描述,如计算出每一单位危险因素变化时,可得超额相对危险度的变化、以及由危险因素所引起超额病例数、超额绝对危险(EAR)、归因危险比(AR)以及超额发病率等。
【关键词】 广义Poisson回归模型 绝对超额危险度模型 超额相对危险度模型 氡子体累积暴露剂量
Poisson回归模型主要用于队列研究资料的分析,鉴于它调整协变量的强大能力,常用以研究多因素对疾病的影响以及暴露与疾病间的剂量反应关系,尤其适用于影响肿瘤发病和死亡的危险因素研究。最常见
的Poisson回归模型是相加模型和相乘模型。但危险因素和疾病的关系是复杂的,需要有更适宜的模型加以描述。因此,本研究试图将广义Poisson回归模型引入肺癌危险因素分析,更为全面地分析疾病和危险因素之间的关系。现以氡子体和肺癌之间的关系为例说明广义Poisson回归模型的应用。
资料与方法
资料来源于1992~1996年与美国NCI合作,在云南锡业公司现场所建立的肺癌高危人群回顾性前瞻队列,共有8412个观察对象。
(一)常用的Poisson回归模型有以下两种(1)相加模型(又称超额危险度模型)
设队列人群有k个暴露组(如k个放射性氡子体暴露组),j个协变量层(如j个年龄组)。如果k水平暴露的效应只是在参照组(k=1)的个体的年龄专率λj1的效应上加了一个常数βk,模型为
λjk=αj+βk
在此,αβ1=0)为数据的待估参数。j=λj1,βk(
(2)相乘模型(又称相对危险度模型)
当原始测量数据不支持相加模型时,可以对率进行某种转换,一般用对数转换,则第j层(j=1,…,J),第k暴露组(k=2,…,K)的估计相对危险度为rjk/rj1,模型为:
λjk=λjΧk
〔1,2〕
λjk表示发病率rjk的期望值函数,λj表示参照组第j层的发病率,Χk>1,当k=1,Χ1)k表示第k组(k=总的相对危险度。
该模型就是乘积模型(Productmodel)。为了计算的方便,可将乘积模型再参数化为对数线性模型,
即:
λα (k=2,…,K)jk=exp(j+βk)
其中αj表示参照组层别发病率的自然对数,βk表示第k组相对危险度(与基线水平相比,Χ1)的自然对1=数。
(二)广义Possion回归模型〔1,3〕:
实际上,从线性模型的角度出发,任何一个应变量是分类变量的回归模型都可表示为下面简单的形式:
logRi=β′Zi 这里,Zi是自变量的矩阵,β是模型要估计的参
数,Ri根据不同的统计模型意义亦不同,如:在条件logistic回归模型中,为病例和对照的比数比;在Cox比例风险模型中,是相对危险度或相对危险比;在分组生存资料的Poisson回归中,是Poisson均值或一个分段常数危险函数。
可以用更为简单的模型描述:
Ri=f(β,Zi)
若要估计分层混杂因素的效应,则采用模型:Ri=αi)f(β,Zi)s( αi)用以表示混杂因素的效应,f表示函数关s(系,该函数可以是相加的,也可以是相乘的,可以是线性的函数,也可以是非线性的函数,或者是界于相加和相乘或线性和非线性之间的函数关系。
广义Poisson回归模型的形式很多,常见的有以下
:
*国家自然科学基金资助项目,(项目编号39770662)1.华西医科大学卫生统计教研室(成都610041)2.云南锡业公司劳动防护研究所(个旧661000)
ChineseJournalofHealthStatistics,June2000,Vol.17,No.3·131·
几种(模型的参数估计均可通过最大似然估计获得):
(1)普通对数线性模型或称作指数相对危险度模型(ExponentialRelativeRiskModel,ERR),模型公式为:
+βz
λ(t,z)=eα
z为一组危险因素的矩阵,α为基线风险函数(发
ER/WLM。
在线性ERR模型和ER模型中可选择一个de-viance相对较小的模型。
(5)非标准模型(NonstandardModels)
除了拟合以上模型,还可对数据拟合如下模型:
z
λ(t,z)=θ1+β2Rn)eβ′s(
病密度)的对数,β为一组危险因素风险函数之比(相对危险度)的对数值。
(2)超额相对危险度模型或称相加相对危险度模型(ExcessRelativeRiskModel或AdditiveModelforRelativeRisk)
分析放射性暴露危险因素,在国际上常采用相加相对危险度模型,现假设放射性氡子体(Rn)的相对危险度是线性的或是二次项的。形式如下:
λ(t,z,Rn)=λ(t,z,0)(1+βRn) 其中,λ(t,z,0)为基线风险函数,β为当氡子体浓度每改变一个单位时超额危险度ERR的改变量,在
评价氡子体危险性时单位为(ERR/WLM),ERR=RR-1。暴露剂量的单位为“WLM”,即工作水平月。在该模型中,由于将危险因素的相对危险度和其他危险因素的相对危险度分开表达,故可以更直观地考察危险因素的相对危险度。
该模型的后半部又可表示为:RR=(1+βRn)
它实际上反映了氡子体和肺癌危险性的暴露-反应关系。据此,可以得到确切的氡子体致肺癌危险性的定量描述。
(3)危险因素引起的超额病例数和超额绝对危险(ExcessiveAbsoluteRisk,EAR)以及归因危险比(AR)的计算〔4〕。
通过以上拟合的ERR模型,可得到在整个随访中每单位Rn所导致的超额发病率和可以归因于放射性氡子体暴露的病例占总病例的比例。
拟合病例数=Piθs(i)(1+β1dosei)背景病例数=Piθs(i)
超额病例数=Piθs(i)β1dosei
Pi是i格中的人年数,s(i)是这格中的分层指标,这对于定量评价危险因素的效应很有价值。
(4)绝对超额危险度模型(AbsoluteExcessRiskModel)
绝对超额危险度模型是相对危险度模型的替代物。在一个超额危险模型中,暴露的效应表示为g(z,w),加上基础肺癌死亡率,即:
λ(x,z,w)=λx)+g(z,w)0(
此处线性的暴露反应模型的模式是
λ(x,w)=λ0(x)+βw
,危险因素氡子体(WLM)
β′z=β3x3+β4x4+β5x5
x3,x4,x5分别为一些危险因素,如慢支炎,读书年限,首次下坑年龄等。
结果与分析
本研究以评价氡子体等的肺癌危险性为例,将初步筛选出的以下10个变量:是否患哮喘、是否患慢支炎、进入队列时年龄、厨房位置、氡子体累积暴露剂量、
是否念过书、砷累积暴露剂量、首次下坑年龄、粉尘累积暴露剂量、吸烟指数拟合广义Poisson回归模型。为表达简洁,现列出几个危险因素的等级划分(表1)。
表1 危险因素暴露剂量范围
暴 露 等 级
10~0~0~
21.88~15~1.25~
1~
3200.42~
19~3~
4
23~
5
332.17~588.37~
首次下坑年龄(岁)受教育年限(年)
吸烟指数(g/天×年)0~302.68~536.385~808.08~
(一)对数线性模型结果:
表2 对数线性模型的拟合结果
变量名常数项氡子体2氡子体3氡子体4氡子体5
回归系数-0.25770.40700.82230.89511.1880
0.57630.50820.50990.5126
0.480
0.4855~4.64900.8405~6.16100.9010~6.64901.2010~8.9610
标准误
P值
95%CI
可以看出,只有氡子体浓度达到第五个剂量水平,暴露人群患肺癌的危险性与基线对照人群相比,差别才有统计学意义。
表3 其他危险因素的危险性分析结果
变量名
回归系数
标准误0.14790.17410.16730.11020.15330.1284
P值0.268>0.5000.020
95%CI0.6354~1.13400.6673~1.32000.5209~1.01000.4794~0.73830.6474~1.18100.4797~0.7936
首次下坑年龄2-0.1638首次下坑年龄3-0.0633首次下坑年龄4-0.4986是否患过慢支读书年限2读书年限3
-0.5193-0.1343-0.4828
2 Deviance=1368.54 自由度=3735 Pearsonχ=7147.15
从结果可看出,大剂量的氡子体暴露、患过慢支炎是云锡矿工肺癌的危险因素,而读书年限3级以上则是保护性因素。 (二)超额相对危险度模型结果
·132·
表4 超额相对危险度模型的拟合结果
变 量 名对数线性项常数项读书2读书3(x1)慢支炎(x2)首次下坑年龄线性项
氡子体(WLM)
0.0009550
0.036
0.64E-04~
0.18E-02
0.5708-0.1490-0.4709-0.5262-0.02836
0.334
0.6368~1.16600.4840~0.80570.4750~0.73500.9479~0.9968
β值
P
95%CI
变量名
对数线性项0常数项线性项1WLM对数线性项1读书2(x1)读书3(x2)慢支炎(x3)
中国卫生统计2000年6月第17卷第3期表6 非标准模型的拟合结果
β-0.9143
0.00076
0.00018~0.123.65~10.401.82~6.320.29~0.74
P
95%CI
2=6700. Deviance=1263.42 自由度=3128 Pearsonχ462
Deviance=1262.45 df=3135 Pearsonχ=5627.11
代入数据模型可写为:
4709x1-0.5262x2-0.02836x3
λ(t,z,Rn)=e-0.(1+
模型可以写作:
123λ(t,Z)=e(1+0.00076Rn)e
模型拟合效果和对数线性模型拟合结果相似,但
-0.914.201x+3.849x-0.75x
0.00095Rn)
氡子体的相对危险度可表示为:RR=(1+
0.00095Rn)
这里ERR=0.00095/WLM,即氡子体累积暴露剂量每增加一个单位,ERR增加0.095%。从本模型可见慢支炎、首次下坑年龄小、大剂量的氡子体暴露是云锡矿工肺癌的危险因素,而读书多于三年是矿工肺癌的保护因素。
(三)由危险因素引起的超额病例数和EAR以及AR的计算结果:
总病例数为336例,归因于氡子体暴露的有123例,其中,氡子体各层暴露所占的数目以及AR(即在总的病例数中由氡子体放射性照射所引起的病例数所占的比例)见表5。
表5 超额病例数及归因危险比的计算结果
层数(WLM)第一层(0)
第二层(1.88~200.41)第三层(200.41~332.17)第四层(332.17~588.37)第五层(≥588.37)
病例数4192881
构成(%)3.250.817.3222.7665.85
AR%12.857.3418.4428.6149.30
它可以对危险因素的效应进行线性表达。
讨 论
1.通过以上分析发现,广义Poisson回归模型在危险因素分析中具有广泛的应用前景。它能运算大规模的队列研究数据,为队列资料的分析提供了更多手段。通过分析不但证实了过去的结论
〔6〕
,而且还得到
了一些过去的分析所未能得到的结果。如,在总的
336例病例中,归因于氡子体暴露产生的病例数为123例;在每一个观察人年每一个工作水平月的氡子体暴露下,会产生1.09×10-5个超额肺癌病例。最为重要的是,通过本次分析发现,并不是只要有氡子体暴露者患肺癌的危险性与基线对照比就有差别,而是只有当氡子体浓度高于一定的界值(高于588.37WLM时),暴露人群患肺癌危险性才高于基线对照。这对制定防治策略非常重要。
2.在过去对于Poisson回归模型的探讨中,应用的最多的是对数线性模型。而在实际研究中,并非所有资料都符合对数线性模型,有的可能符合类线性或固有非线性模型,有的模型形式可能更复杂。只有根据数据特点,采用合适的模型,才能真正揭示疾病和危险因素之间的关系,而广义Poisson回归模型能够较好地满足上述要求。
3.在广义Poisson回归模型的各种模型中,超额相对危险度模型还可以提供当危险因素累积暴露剂量每增加一个单位,相对危险度的增加量,同时还可计算危险因素引起的超额病例数和超额绝对危险以及归因危险度,这对于危险因素的定量分析提供了更切实的依据。
4.通过分析还发现,在慢性病的危险因素分析中,随着年龄的增长,疾病的发病率呈指数上升,用相乘模型描述疾病和危险因素之间的关系优于相加模型。
EAR=1.09×10-5/WLM·人年,即在每一个观察人年每一个工作水平月的氡子体暴露下,会产生1.09×10-5个超额肺癌病例。
(四)绝对超额危险度模型结果
为寻找最佳模型,还对数据拟合了绝对超额危险度模型。但是在拟合模型时发现,无论怎样组合变量
进入模型,模型都具有较大的deviance值并且氡子体变得与肺癌发生毫无关系。说明用绝对超额危险模型表达氡子体和肺癌之间的联系不够准确。这与Dr.Lubin的分析一致:“在分析中(对氡子体致肺癌的危险性分析),相对危险模型一般比超额危险模型的de-viance更小……。”
(五)非标准模型
〔5〕
ChineseJournalofHealthStatistics,June2000,Vol.17,No.3·133·
siverelativeriskmodel Absolutiveexcessiveriskmodel The
GeneralizedPoissonRegressionanditsApplication ZhangYing,NiZongzan,YaoShuxiang,etal.,WestChinaUniversityofMedicalScience(610041).Chengdu.
radondaughterexposuredose
参 考 文 献
1.李克,俞顺章.Poisson模型与队列研究———原理与应用.中国卫生统
【Abstract】 Objective ToexploretheapplicabilityofgeneralizedpoissionregressioninEpidemiologiccohortdata.Methods FittingExces-siveRelativeRiskModels,AbsolutiveExcessiveRiskModel,andsoontotheYTCcohortdata.Results Itisfoundthattherewouldbe1.09×10-5excessivelungcancercasesfor1WLMforonepersonyear.Thelungcancerof123cohortsubjectsamongallofthe336patientscouldbeat-tributedtotheradondaughterexposuredoseofradondaughtermorethan588.73WLMwouldhavethehigherriskoflungcancer,whilecomparedwiththebaselinecontrol.Conclusion Theapplicationofgeneralizedpois-sonregressioncouldreachdeeperimpressionaboutriskfactorsofinterest.Forexample,thechangeofexcessiverelativerisk,thecalculationofexces-sivecases,andtheestimationofAttributableRiskRationforthechangeofoneunitofexposurecouldbeconductedunderthepoissonregerssionmod-els.
计,1997,14(1):46.
2.宇传华,余松林,Poisson回归在职业队列研究中的应用.中国卫生统计,1996,13(1):6.
3.PrestonD.L.,Lubin,J.H.,andPierce,D.A.EPICURE:RiskRegres-sionandDataAnalysisSoftware.Seattle,Washington:HirosoftInterna-tionalCooperation,1993.
4.BreslowNE,DayNE.Statisticalmethodsincancerresearch.Vol.Ⅱ.Thedesignandanalysisofcohortstudies.Lyon:LARC,1987.
5.ShuXiangYao,JayH.Lubin,You-linQiao,etal.ExposuretoRadonProgeny,TobaccoUseandLungCancerinaCase-ControlStudyinSouthernChina.RadiationResearch,1994,(138):326.
6.JayH.Lubinetal.RadonandLungCancerRisk:AJointAnalysisof11UndergroundMinersStudies.U.S.DepartmentofHealthandHumanServices,PublicHealthService,NIH.1994.
【Keywords】 Generalizedpoissonregressionmodels Exces-
医院实现网络化管理后统计工作的特点与体会
兰州军区乌鲁木齐总医院信息科(830000)解放军第十五医院新疆军区联勤部门诊部
严金燕
扬 超严红艳
随着医院信息管理网络化的实现,我院于1997年下半年
引进了《军卫一号工程》软件,在全院实现了计算机联网。在一年多的运行实践中,收到了良好的经济效益和管理效益,现就计算机管理运行过程中统计工作的特点和体会介绍如下:
1.原有统计工作中存在的弊端
过去运行的《医院信息管理》软件是建立在单用户基础上的,运行中存在着原始统计数据收集方法落后、大量数据转抄、转录次数多、手续繁琐、速度慢等问题。加之医务人员对统计数据重要性认识不够,常常出现数据不准确的现象,给管理部门提供了错误信息。
2.实现网络化管理的特点
针对原有统计工作中存在的弊端,我院引进的全军信息系统《军卫一号工程》软件,是集门诊、住院、收费、病案、统计、查询等为一体的管理型软件。它形成了病人就医全过程的计算机管理,病人信息由各部门分类输入,减少了数据转抄、转录等中间环节过多而造成的人为误差,提高了统计数据的准确性。
系统在各科室计算机病人信息库管理的基础上,可任意对全部或部分信息进行查询,实现了住院病人的住院时查询和出院后查询。管理者可通过网络对全院病人情况随时进行了解,对每份病案记录、医嘱、护理等情况进行监控,实现了计算机查房。数据信息随时提取,且种类齐全,实现了全院信息共享,满足了医院当前应用和未来一段时间发展的需要。
3.统计管理网络化运行的体会
系统一年多的运行证明,它功能全、速度快、效率高、省时省力,具有良好的灵活性和实用性。它把统计人员从繁杂的统计工作中解脱出来,为医院领导决策提供了全面、客观、现实的数据。系统对所有的统计数据、表格、图表进行自动分类存储,为医院保存了宝贵的第一手统计资料,为医护人员提供各类医、教、研所需的各类数据信息,满足了当前统计数据需求量大、内容复杂、准确度高的要求。医院实行网络化管理后,要求网上各个工作环节必须密切配合,认真负责,相互协调,把联网后统计工作的及时性和准确性真正体现出来,切实做好联网后的医院统计工作,使医院网络管理充分发挥作用。
·130·
中国卫生统计2000年6月第17卷第3期广义Poisson回归模型及其应用*
张 颖1 倪宗瓒1 姚树祥2 姜 勇2 巫秀美1
【提 要】 目的 探讨广义Poisson回归模型在流行病学队列资料分析中的应用与价值。方法 拟合超额相对危险
度模型,绝对超额危险度模型,非标准模型等分析云锡现场队列研究资料。结果 在云锡肺癌现场,每一个观察人年每一工作水平月的氡子体暴露,会产生1.09×10-5个肺癌超额病例。在总的336例病例中,归因于氡子体暴露的有123例。只有当氡子体累积暴露高于588.37WLM时,暴露人群患肺癌危险性才高于基线对照。结论 广义Poisson回归模型的拟合可以得到对于危险因素的更深入描述,如计算出每一单位危险因素变化时,可得超额相对危险度的变化、以及由危险因素所引起超额病例数、超额绝对危险(EAR)、归因危险比(AR)以及超额发病率等。
【关键词】 广义Poisson回归模型 绝对超额危险度模型 超额相对危险度模型 氡子体累积暴露剂量
Poisson回归模型主要用于队列研究资料的分析,鉴于它调整协变量的强大能力,常用以研究多因素对疾病的影响以及暴露与疾病间的剂量反应关系,尤其适用于影响肿瘤发病和死亡的危险因素研究。最常见
的Poisson回归模型是相加模型和相乘模型。但危险因素和疾病的关系是复杂的,需要有更适宜的模型加以描述。因此,本研究试图将广义Poisson回归模型引入肺癌危险因素分析,更为全面地分析疾病和危险因素之间的关系。现以氡子体和肺癌之间的关系为例说明广义Poisson回归模型的应用。
资料与方法
资料来源于1992~1996年与美国NCI合作,在云南锡业公司现场所建立的肺癌高危人群回顾性前瞻队列,共有8412个观察对象。
(一)常用的Poisson回归模型有以下两种(1)相加模型(又称超额危险度模型)
设队列人群有k个暴露组(如k个放射性氡子体暴露组),j个协变量层(如j个年龄组)。如果k水平暴露的效应只是在参照组(k=1)的个体的年龄专率λj1的效应上加了一个常数βk,模型为
λjk=αj+βk
在此,αβ1=0)为数据的待估参数。j=λj1,βk(
(2)相乘模型(又称相对危险度模型)
当原始测量数据不支持相加模型时,可以对率进行某种转换,一般用对数转换,则第j层(j=1,…,J),第k暴露组(k=2,…,K)的估计相对危险度为rjk/rj1,模型为:
λjk=λjΧk
〔1,2〕
λjk表示发病率rjk的期望值函数,λj表示参照组第j层的发病率,Χk>1,当k=1,Χ1)k表示第k组(k=总的相对危险度。
该模型就是乘积模型(Productmodel)。为了计算的方便,可将乘积模型再参数化为对数线性模型,
即:
λα (k=2,…,K)jk=exp(j+βk)
其中αj表示参照组层别发病率的自然对数,βk表示第k组相对危险度(与基线水平相比,Χ1)的自然对1=数。
(二)广义Possion回归模型〔1,3〕:
实际上,从线性模型的角度出发,任何一个应变量是分类变量的回归模型都可表示为下面简单的形式:
logRi=β′Zi 这里,Zi是自变量的矩阵,β是模型要估计的参
数,Ri根据不同的统计模型意义亦不同,如:在条件logistic回归模型中,为病例和对照的比数比;在Cox比例风险模型中,是相对危险度或相对危险比;在分组生存资料的Poisson回归中,是Poisson均值或一个分段常数危险函数。
可以用更为简单的模型描述:
Ri=f(β,Zi)
若要估计分层混杂因素的效应,则采用模型:Ri=αi)f(β,Zi)s( αi)用以表示混杂因素的效应,f表示函数关s(系,该函数可以是相加的,也可以是相乘的,可以是线性的函数,也可以是非线性的函数,或者是界于相加和相乘或线性和非线性之间的函数关系。
广义Poisson回归模型的形式很多,常见的有以下
:
*国家自然科学基金资助项目,(项目编号39770662)1.华西医科大学卫生统计教研室(成都610041)2.云南锡业公司劳动防护研究所(个旧661000)
ChineseJournalofHealthStatistics,June2000,Vol.17,No.3·131·
几种(模型的参数估计均可通过最大似然估计获得):
(1)普通对数线性模型或称作指数相对危险度模型(ExponentialRelativeRiskModel,ERR),模型公式为:
+βz
λ(t,z)=eα
z为一组危险因素的矩阵,α为基线风险函数(发
ER/WLM。
在线性ERR模型和ER模型中可选择一个de-viance相对较小的模型。
(5)非标准模型(NonstandardModels)
除了拟合以上模型,还可对数据拟合如下模型:
z
λ(t,z)=θ1+β2Rn)eβ′s(
病密度)的对数,β为一组危险因素风险函数之比(相对危险度)的对数值。
(2)超额相对危险度模型或称相加相对危险度模型(ExcessRelativeRiskModel或AdditiveModelforRelativeRisk)
分析放射性暴露危险因素,在国际上常采用相加相对危险度模型,现假设放射性氡子体(Rn)的相对危险度是线性的或是二次项的。形式如下:
λ(t,z,Rn)=λ(t,z,0)(1+βRn) 其中,λ(t,z,0)为基线风险函数,β为当氡子体浓度每改变一个单位时超额危险度ERR的改变量,在
评价氡子体危险性时单位为(ERR/WLM),ERR=RR-1。暴露剂量的单位为“WLM”,即工作水平月。在该模型中,由于将危险因素的相对危险度和其他危险因素的相对危险度分开表达,故可以更直观地考察危险因素的相对危险度。
该模型的后半部又可表示为:RR=(1+βRn)
它实际上反映了氡子体和肺癌危险性的暴露-反应关系。据此,可以得到确切的氡子体致肺癌危险性的定量描述。
(3)危险因素引起的超额病例数和超额绝对危险(ExcessiveAbsoluteRisk,EAR)以及归因危险比(AR)的计算〔4〕。
通过以上拟合的ERR模型,可得到在整个随访中每单位Rn所导致的超额发病率和可以归因于放射性氡子体暴露的病例占总病例的比例。
拟合病例数=Piθs(i)(1+β1dosei)背景病例数=Piθs(i)
超额病例数=Piθs(i)β1dosei
Pi是i格中的人年数,s(i)是这格中的分层指标,这对于定量评价危险因素的效应很有价值。
(4)绝对超额危险度模型(AbsoluteExcessRiskModel)
绝对超额危险度模型是相对危险度模型的替代物。在一个超额危险模型中,暴露的效应表示为g(z,w),加上基础肺癌死亡率,即:
λ(x,z,w)=λx)+g(z,w)0(
此处线性的暴露反应模型的模式是
λ(x,w)=λ0(x)+βw
,危险因素氡子体(WLM)
β′z=β3x3+β4x4+β5x5
x3,x4,x5分别为一些危险因素,如慢支炎,读书年限,首次下坑年龄等。
结果与分析
本研究以评价氡子体等的肺癌危险性为例,将初步筛选出的以下10个变量:是否患哮喘、是否患慢支炎、进入队列时年龄、厨房位置、氡子体累积暴露剂量、
是否念过书、砷累积暴露剂量、首次下坑年龄、粉尘累积暴露剂量、吸烟指数拟合广义Poisson回归模型。为表达简洁,现列出几个危险因素的等级划分(表1)。
表1 危险因素暴露剂量范围
暴 露 等 级
10~0~0~
21.88~15~1.25~
1~
3200.42~
19~3~
4
23~
5
332.17~588.37~
首次下坑年龄(岁)受教育年限(年)
吸烟指数(g/天×年)0~302.68~536.385~808.08~
(一)对数线性模型结果:
表2 对数线性模型的拟合结果
变量名常数项氡子体2氡子体3氡子体4氡子体5
回归系数-0.25770.40700.82230.89511.1880
0.57630.50820.50990.5126
0.480
0.4855~4.64900.8405~6.16100.9010~6.64901.2010~8.9610
标准误
P值
95%CI
可以看出,只有氡子体浓度达到第五个剂量水平,暴露人群患肺癌的危险性与基线对照人群相比,差别才有统计学意义。
表3 其他危险因素的危险性分析结果
变量名
回归系数
标准误0.14790.17410.16730.11020.15330.1284
P值0.268>0.5000.020
95%CI0.6354~1.13400.6673~1.32000.5209~1.01000.4794~0.73830.6474~1.18100.4797~0.7936
首次下坑年龄2-0.1638首次下坑年龄3-0.0633首次下坑年龄4-0.4986是否患过慢支读书年限2读书年限3
-0.5193-0.1343-0.4828
2 Deviance=1368.54 自由度=3735 Pearsonχ=7147.15
从结果可看出,大剂量的氡子体暴露、患过慢支炎是云锡矿工肺癌的危险因素,而读书年限3级以上则是保护性因素。 (二)超额相对危险度模型结果
·132·
表4 超额相对危险度模型的拟合结果
变 量 名对数线性项常数项读书2读书3(x1)慢支炎(x2)首次下坑年龄线性项
氡子体(WLM)
0.0009550
0.036
0.64E-04~
0.18E-02
0.5708-0.1490-0.4709-0.5262-0.02836
0.334
0.6368~1.16600.4840~0.80570.4750~0.73500.9479~0.9968
β值
P
95%CI
变量名
对数线性项0常数项线性项1WLM对数线性项1读书2(x1)读书3(x2)慢支炎(x3)
中国卫生统计2000年6月第17卷第3期表6 非标准模型的拟合结果
β-0.9143
0.00076
0.00018~0.123.65~10.401.82~6.320.29~0.74
P
95%CI
2=6700. Deviance=1263.42 自由度=3128 Pearsonχ462
Deviance=1262.45 df=3135 Pearsonχ=5627.11
代入数据模型可写为:
4709x1-0.5262x2-0.02836x3
λ(t,z,Rn)=e-0.(1+
模型可以写作:
123λ(t,Z)=e(1+0.00076Rn)e
模型拟合效果和对数线性模型拟合结果相似,但
-0.914.201x+3.849x-0.75x
0.00095Rn)
氡子体的相对危险度可表示为:RR=(1+
0.00095Rn)
这里ERR=0.00095/WLM,即氡子体累积暴露剂量每增加一个单位,ERR增加0.095%。从本模型可见慢支炎、首次下坑年龄小、大剂量的氡子体暴露是云锡矿工肺癌的危险因素,而读书多于三年是矿工肺癌的保护因素。
(三)由危险因素引起的超额病例数和EAR以及AR的计算结果:
总病例数为336例,归因于氡子体暴露的有123例,其中,氡子体各层暴露所占的数目以及AR(即在总的病例数中由氡子体放射性照射所引起的病例数所占的比例)见表5。
表5 超额病例数及归因危险比的计算结果
层数(WLM)第一层(0)
第二层(1.88~200.41)第三层(200.41~332.17)第四层(332.17~588.37)第五层(≥588.37)
病例数4192881
构成(%)3.250.817.3222.7665.85
AR%12.857.3418.4428.6149.30
它可以对危险因素的效应进行线性表达。
讨 论
1.通过以上分析发现,广义Poisson回归模型在危险因素分析中具有广泛的应用前景。它能运算大规模的队列研究数据,为队列资料的分析提供了更多手段。通过分析不但证实了过去的结论
〔6〕
,而且还得到
了一些过去的分析所未能得到的结果。如,在总的
336例病例中,归因于氡子体暴露产生的病例数为123例;在每一个观察人年每一个工作水平月的氡子体暴露下,会产生1.09×10-5个超额肺癌病例。最为重要的是,通过本次分析发现,并不是只要有氡子体暴露者患肺癌的危险性与基线对照比就有差别,而是只有当氡子体浓度高于一定的界值(高于588.37WLM时),暴露人群患肺癌危险性才高于基线对照。这对制定防治策略非常重要。
2.在过去对于Poisson回归模型的探讨中,应用的最多的是对数线性模型。而在实际研究中,并非所有资料都符合对数线性模型,有的可能符合类线性或固有非线性模型,有的模型形式可能更复杂。只有根据数据特点,采用合适的模型,才能真正揭示疾病和危险因素之间的关系,而广义Poisson回归模型能够较好地满足上述要求。
3.在广义Poisson回归模型的各种模型中,超额相对危险度模型还可以提供当危险因素累积暴露剂量每增加一个单位,相对危险度的增加量,同时还可计算危险因素引起的超额病例数和超额绝对危险以及归因危险度,这对于危险因素的定量分析提供了更切实的依据。
4.通过分析还发现,在慢性病的危险因素分析中,随着年龄的增长,疾病的发病率呈指数上升,用相乘模型描述疾病和危险因素之间的关系优于相加模型。
EAR=1.09×10-5/WLM·人年,即在每一个观察人年每一个工作水平月的氡子体暴露下,会产生1.09×10-5个超额肺癌病例。
(四)绝对超额危险度模型结果
为寻找最佳模型,还对数据拟合了绝对超额危险度模型。但是在拟合模型时发现,无论怎样组合变量
进入模型,模型都具有较大的deviance值并且氡子体变得与肺癌发生毫无关系。说明用绝对超额危险模型表达氡子体和肺癌之间的联系不够准确。这与Dr.Lubin的分析一致:“在分析中(对氡子体致肺癌的危险性分析),相对危险模型一般比超额危险模型的de-viance更小……。”
(五)非标准模型
〔5〕
ChineseJournalofHealthStatistics,June2000,Vol.17,No.3·133·
siverelativeriskmodel Absolutiveexcessiveriskmodel The
GeneralizedPoissonRegressionanditsApplication ZhangYing,NiZongzan,YaoShuxiang,etal.,WestChinaUniversityofMedicalScience(610041).Chengdu.
radondaughterexposuredose
参 考 文 献
1.李克,俞顺章.Poisson模型与队列研究———原理与应用.中国卫生统
【Abstract】 Objective ToexploretheapplicabilityofgeneralizedpoissionregressioninEpidemiologiccohortdata.Methods FittingExces-siveRelativeRiskModels,AbsolutiveExcessiveRiskModel,andsoontotheYTCcohortdata.Results Itisfoundthattherewouldbe1.09×10-5excessivelungcancercasesfor1WLMforonepersonyear.Thelungcancerof123cohortsubjectsamongallofthe336patientscouldbeat-tributedtotheradondaughterexposuredoseofradondaughtermorethan588.73WLMwouldhavethehigherriskoflungcancer,whilecomparedwiththebaselinecontrol.Conclusion Theapplicationofgeneralizedpois-sonregressioncouldreachdeeperimpressionaboutriskfactorsofinterest.Forexample,thechangeofexcessiverelativerisk,thecalculationofexces-sivecases,andtheestimationofAttributableRiskRationforthechangeofoneunitofexposurecouldbeconductedunderthepoissonregerssionmod-els.
计,1997,14(1):46.
2.宇传华,余松林,Poisson回归在职业队列研究中的应用.中国卫生统计,1996,13(1):6.
3.PrestonD.L.,Lubin,J.H.,andPierce,D.A.EPICURE:RiskRegres-sionandDataAnalysisSoftware.Seattle,Washington:HirosoftInterna-tionalCooperation,1993.
4.BreslowNE,DayNE.Statisticalmethodsincancerresearch.Vol.Ⅱ.Thedesignandanalysisofcohortstudies.Lyon:LARC,1987.
5.ShuXiangYao,JayH.Lubin,You-linQiao,etal.ExposuretoRadonProgeny,TobaccoUseandLungCancerinaCase-ControlStudyinSouthernChina.RadiationResearch,1994,(138):326.
6.JayH.Lubinetal.RadonandLungCancerRisk:AJointAnalysisof11UndergroundMinersStudies.U.S.DepartmentofHealthandHumanServices,PublicHealthService,NIH.1994.
【Keywords】 Generalizedpoissonregressionmodels Exces-
医院实现网络化管理后统计工作的特点与体会
兰州军区乌鲁木齐总医院信息科(830000)解放军第十五医院新疆军区联勤部门诊部
严金燕
扬 超严红艳
随着医院信息管理网络化的实现,我院于1997年下半年
引进了《军卫一号工程》软件,在全院实现了计算机联网。在一年多的运行实践中,收到了良好的经济效益和管理效益,现就计算机管理运行过程中统计工作的特点和体会介绍如下:
1.原有统计工作中存在的弊端
过去运行的《医院信息管理》软件是建立在单用户基础上的,运行中存在着原始统计数据收集方法落后、大量数据转抄、转录次数多、手续繁琐、速度慢等问题。加之医务人员对统计数据重要性认识不够,常常出现数据不准确的现象,给管理部门提供了错误信息。
2.实现网络化管理的特点
针对原有统计工作中存在的弊端,我院引进的全军信息系统《军卫一号工程》软件,是集门诊、住院、收费、病案、统计、查询等为一体的管理型软件。它形成了病人就医全过程的计算机管理,病人信息由各部门分类输入,减少了数据转抄、转录等中间环节过多而造成的人为误差,提高了统计数据的准确性。
系统在各科室计算机病人信息库管理的基础上,可任意对全部或部分信息进行查询,实现了住院病人的住院时查询和出院后查询。管理者可通过网络对全院病人情况随时进行了解,对每份病案记录、医嘱、护理等情况进行监控,实现了计算机查房。数据信息随时提取,且种类齐全,实现了全院信息共享,满足了医院当前应用和未来一段时间发展的需要。
3.统计管理网络化运行的体会
系统一年多的运行证明,它功能全、速度快、效率高、省时省力,具有良好的灵活性和实用性。它把统计人员从繁杂的统计工作中解脱出来,为医院领导决策提供了全面、客观、现实的数据。系统对所有的统计数据、表格、图表进行自动分类存储,为医院保存了宝贵的第一手统计资料,为医护人员提供各类医、教、研所需的各类数据信息,满足了当前统计数据需求量大、内容复杂、准确度高的要求。医院实行网络化管理后,要求网上各个工作环节必须密切配合,认真负责,相互协调,把联网后统计工作的及时性和准确性真正体现出来,切实做好联网后的医院统计工作,使医院网络管理充分发挥作用。