第二章 描述性研究
描述性研究(descriptive study)又称描述流行病学,是流行病学最基本的的研究方法。它往往是病因不明疾病病因探索的起点。
第一节 描述性研究概述
一、 概念
描述性研究是利用专门设计调查的资料或已有的资料,按不同人群、不同地区及不同时间即三间分布的特点分组,把疾病或健康状态的分布情况真实地描绘、叙述出来。为进一步建立病因假设和病因研究提供基础资料。描述性研究在揭示因果关系的探索中是基础的步骤。
二、 描述性研究的种类
主要有病例调查、暴发研究、生态学研究和现况调查等。
(一) 病例调查
病例调查——又称个案调查,是指对个别病例或相应的个体及周围环境进行调查。
(二) 生态学研究
生态学研究——是在群体水平上研究某种因素与疾病之间的关系。生态学研究的基本特点是以群体为单位。
生态学研究是从许多因素中探索病因线索的一种方法,有一定的局限性和提供信息的不完全性。可以说是一种粗线条的描述性研究。
(三) 现况调查(详见第二节)
三、 描述性研究的主要用途
1、 社区诊断:可描述疾病或健康状态在该社区人群的分布及其特征。调查和评价该社区的某些疾病。为进一步干预提供依据。
2、 描述和分析某些因素与疾病或健康状态之间的关联,为进一步的病因研究和危险因素研究提供线索。 3、 通过比较实施疾病防控对策前后的资料,为评价其效果提供基础信息。
第二节 现况研究概述
一、 概念
现况研究(调查)——是研究特定时点或时期与特定范围内人群中的有关变量(因素)与疾病或健康状况的关系,即是调查这个特定的群体中的个体是否患病和是否具有某些变量或特征的情况,从而探索具有不同特征的暴露与非暴露组的患病情况,或是否患病组的暴露情况。
现况调查因为所用的指标主要是患病率——患病率调查。又因现况调查在某一时点收集的反映该时点的暴露或疾病情况。——又称为横断面研究。
现况调查主要用于病程较长、发病率较高的疾病。
二、 现况研究的目的
(一)掌握人群中疾病的患病率及其分布状态。采用的方法是抽样调查。
(二)提供疾病的致病因素的线索。通过描述患病率在不同暴露因素状态上的分布现象,建立病因假设。
(三)确定高危人群。高危人群是指由于遗传、营养、免疫以及暴露于某特定环境中等个体因素,使他们容易患有某种疾病。
(四)评价疾病监测、预防接种效果及其他资料质量。通过抽样调查,评价该疾病监测系统或预防接种的资料完整性、可靠性和正确程度。
三、 现况研究的特点和种类
(一)特点
1、现况调查开始时一般不设有对照组。
在其开始时,根据研究的目的来确定研究的对象,然后查明该研究对象中每个人在某一特定时点上的暴露(特征)和疾病的状态,并对其进行比较。
2、有特定时点或时期。
现况研究是调查某一特定时点上或时期内某一群体中暴露和疾病的状况或联系。
3、在确定因果联系时受到限制。
一般而言,现况研究所揭示的暴露与疾病之间的统计学联系,仅为建立因果联系提供线索,而不能以此作因果推论。
原因:(1)现况调查多为存活期长的病人,这是很可能会混淆影响存活的因素和影响发病的因素。(2)现况调查揭示的是某时点暴露与疾病的关系,但不能决定两者的时间顺序关系。
4、对不会发生改变的暴露因素,可以作因果推论。 如性别、种族、血型等因素。
5、定期重复进行可获得发病率资料。
(二)种类
1.普查(census)
普查——指在特定时点或时期、特定范围内的全部人群(总体)均为研究对象的调查。
目的:了解某病的患病率或某人群的健康状况,疾病的早期发现和诊断。
要求:(1)特定时间应该较短,一般为1-2天或1-2周,大规模普查也不要超过2-3个月。
(2)多用于患病率较高的疾病,且比较简易而
准确的检测手段与方法。并对该病有较好的治疗方法。
(3)人力、物力和设备条件要有保证。
优缺点:
优点:早发现、早诊断,没有抽样误差,易于普及医学卫生知识。
缺点:①工作量大而有可能影响诊断的准确性;②如果人力物力不足会影响检查的速度与精确性;③不适用于患病率低、无简便易行诊断手段的疾病;④普查的费用往往较大。
2.抽样调查(sampling survey)
抽样调查——指通过随机抽样的方法,对特定时点、特定范围内人群的一个代表性样本的调查,即通过样本中的调查结果来推论其所在总体的情况。
目的:描述疾病在时间、空间和人群特征上的分布及影响因素;衡量群体的卫生水平;检查与衡量资料的质量。
要求:(1)要遵循随机化和样本量适当的原则;(2)避免由系统误差而引起偏倚。
优缺点:
优点:节省时间、人力和物力,调查范围小。工作容易做的细致。适用于发病率较高的疾病。
缺点:调查的设计、实施与资料分析复杂;重复或遗漏不易被发现;且不适用调查变异较大的资料。
第一节 现况研究的设计与实施
一、 明确调查的目的和类型
根据研究所提出的问题,明确该次调查所要达到的目的,再根据目的来确定采用的方法。
二、 确定研究对象
根据研究目的和实际情况来选择研究对象。(1)如果是普查,研究对象可规定为某个区域内的全部或部分居民。
(2)如果是抽样调查,首先要明确总体是什么,然后再明确采用的方法和样本数。
三、 样本含量和抽样方法
(一)样本含量
1、样本量的决定因素
①预期的现患率(P),如现患率低,则样本量要大;反之,则可小些。
②精确度,即允许误差(d),精确度越高,允许误差越小,所需样本就越大;反之,则样本量不必过大。
2、样本量的计算公式
(1)调查率时:
设N=样本数,P=估计现患率,Q=1-P,样本的现患率p与总体现患率P之间的差异为d。
则P-p=±d
当允许误差d=0.1P时,则N=400Q/P
当允许误差d=0.15P时,则N=178Q/P
(2)调查均数时:
N=(Uασ/δ)2
N=所需样本数,Uα=正态分布中自左至右的累积概率,σ=标准差,δ=允许误差。
当α取0.05时,S为样本的预期标准差,d为允许误差,则N=4S2/d2
如从有限总体中抽样则按公式校正计算样本含量ncnc=n/(1+n/N)
(二)抽样方法
抽样分为非随机抽样(典型调查)和随机抽样。随机抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样。 随机抽样要求遵循随机化原则,即得到总体中每一个对象都有同等机会被选入作为研究对象,以保证样本的代表性。
1、单纯随机抽样
单纯随机抽样也称简单随机抽样,是从总体N个对象中,利用抽签或其他随机方法(如随机数字)抽取n个,构成一个样本。
2、系统抽样
系统抽样又称机械抽样,是按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。
方法:设总体单位数为N,需要调查的样本数为n,则抽样比为n/N,抽样间隔为K=N/n。将每K个单位为一组,然后用随机方法确定每一组的单位号(1,2,3,···,K),最后每隔K个单位抽取一个作为研究对象。
优点:①事先不需要知道总体内的单位数,可以根据估计而确定抽样间隔(K);
②在人群现场易操作;
③分布比较均匀,代表性较好。
缺点:假如总体各单位的分布有周期性趋势,而抽取的间隔恰好是其周期,则可能产生偏性,会使结果产生偏倚。
3、分层抽样
分层抽样是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行随机随机抽样。
其抽样误差小,代表性好。
4、整群抽样
整群抽样是将总体分成若干群组,抽取其中部分群组作为观察单位组成样本的抽样方法。若被抽到的群组中的全部个体均作为调查对象,称为单纯整群抽样(simple cluster sampling);若调查部分个体,称为二阶段抽样(two stages sampling)。
优点:①易于组织、实施方便,可以节省人力、物力;②如群间差异越小,抽取的群越多,则精密度越好;
缺点:抽样误差较大,故样本量比其他方法要增加1/2。
5、多级抽样
多级抽样是将上述方法综合运用的方法,多用于大型流行病学调查。
先从总体中抽取范围较大的单元,称为一级抽样单位(如省),再从每个抽得的一级单元中抽取范围较小的二级单
元(县),依次类推,最后抽取其中范围更小的单元(如村)作为调查单位。
优点:可以充分利用各种抽样方法的优势,克服各自的不足,并能节省人力、物力。
缺点:在抽样之前要掌握各级调查单位的人口资料及特点。
四、 确定收集资料的方法
收集资料的方法一经确定,就不应变更。一般有两种方法:一是通过测定或检查的方法,如测定血压是否正常等。另一是通过直接用调查表询问研究对象,让其回答或回忆暴露或疾病的情况。
资料的收集过程中,要明确和统一暴露(特征)的规定(定义)和疾病的标准。
五、 现况调查中常见的偏倚与质量控制
(一) 常见的偏倚
偏倚——是指在流行病学研究中,从研究设计到实施,资料分析的结果解释存在的系统误差。
系统误差——指由于研究设计、实施、分析的不当,而导致结果与真实不符的现象。
1、 选择偏倚
选择偏倚——是指选择出的研究对象或样本人群与其代表的总体间的某些特征具有系统误差。包括无应答偏倚、
幸存者偏倚和志愿者偏倚。
2、 信息偏倚
信息偏倚——是指由于观察和测量方法上有缺陷,使各比较组所获得的信息产生系统误差。又称为观察偏倚或测量偏倚。包括回忆偏倚、报告偏倚和观察者偏倚。
(二) 质量控制
为减少各种偏倚的产生,在具体操作时应注意:
1.严格遵照抽样方法的要求,确保抽样过程的随机化原则的完全实施;
2.提高研究对象的依从性和受检率;
3.正确选择测量工具和检测方法;
4.健全研究组织和网络,调查员一定要经过培训,统一标准和认识;
5.做好资料的复查、复核等工作;
6.选择正确的统计分析方法,注意辨析混杂因素及其影响。
六、 调查表和调查员
(一)调查表编制方法
调查表是研究者根据研究目的,将研究内容具体化,以一系列问题的形式提出来的一种表格,是收集研究所需要资料的工具。
调查表中的问题应反映全部的研究内容。
注意问题:
1、调查表中各问题之间的逻辑性和连贯性。
2、被调查者的心理状态。
3、尽量避免使用专业术语和使被调查者反感或难堪的问题。
4、问题不能带有导向性。
另外,在正式调查之前需要进行预调查,以确定调查的可行性,及时修正调查表。
(二)调查项目(变量)的规定
1、定义研究因素:对研究的任何一个因素或变量,都应有明确的定义。
2、明确诊断标准。
3、设定测量尺度。
(三)调查员
1、必须经过培训,能够掌握诸标准。
2、必须要有实事求是的科学态度,无偏见,不造假。
3、必须具有责任感,能对调查资料保密。
4、必须保持中立的态度,不可有任何形式的暗示或导向性语句或示意。
(四)知情同意(informed consent)
知情同意是指在调查前向调查对象说明该调查的目的、时间、资料的用途和保密等,得到理解、认可和同意。
七、 现况调查的资料分析
以Ferris和Anderson(1962)所进行的一个关于慢性呼吸道疾病与吸烟、空气污染的现况研究资料为例(详见教材)。
复习思考题:
1、 什么叫现况调查?它有何作用?包括哪几种类型?
2、 什么叫随机化抽样?医学研究中常见的抽样方法有哪些?
第二章 描述性研究
描述性研究(descriptive study)又称描述流行病学,是流行病学最基本的的研究方法。它往往是病因不明疾病病因探索的起点。
第一节 描述性研究概述
一、 概念
描述性研究是利用专门设计调查的资料或已有的资料,按不同人群、不同地区及不同时间即三间分布的特点分组,把疾病或健康状态的分布情况真实地描绘、叙述出来。为进一步建立病因假设和病因研究提供基础资料。描述性研究在揭示因果关系的探索中是基础的步骤。
二、 描述性研究的种类
主要有病例调查、暴发研究、生态学研究和现况调查等。
(一) 病例调查
病例调查——又称个案调查,是指对个别病例或相应的个体及周围环境进行调查。
(二) 生态学研究
生态学研究——是在群体水平上研究某种因素与疾病之间的关系。生态学研究的基本特点是以群体为单位。
生态学研究是从许多因素中探索病因线索的一种方法,有一定的局限性和提供信息的不完全性。可以说是一种粗线条的描述性研究。
(三) 现况调查(详见第二节)
三、 描述性研究的主要用途
1、 社区诊断:可描述疾病或健康状态在该社区人群的分布及其特征。调查和评价该社区的某些疾病。为进一步干预提供依据。
2、 描述和分析某些因素与疾病或健康状态之间的关联,为进一步的病因研究和危险因素研究提供线索。 3、 通过比较实施疾病防控对策前后的资料,为评价其效果提供基础信息。
第二节 现况研究概述
一、 概念
现况研究(调查)——是研究特定时点或时期与特定范围内人群中的有关变量(因素)与疾病或健康状况的关系,即是调查这个特定的群体中的个体是否患病和是否具有某些变量或特征的情况,从而探索具有不同特征的暴露与非暴露组的患病情况,或是否患病组的暴露情况。
现况调查因为所用的指标主要是患病率——患病率调查。又因现况调查在某一时点收集的反映该时点的暴露或疾病情况。——又称为横断面研究。
现况调查主要用于病程较长、发病率较高的疾病。
二、 现况研究的目的
(一)掌握人群中疾病的患病率及其分布状态。采用的方法是抽样调查。
(二)提供疾病的致病因素的线索。通过描述患病率在不同暴露因素状态上的分布现象,建立病因假设。
(三)确定高危人群。高危人群是指由于遗传、营养、免疫以及暴露于某特定环境中等个体因素,使他们容易患有某种疾病。
(四)评价疾病监测、预防接种效果及其他资料质量。通过抽样调查,评价该疾病监测系统或预防接种的资料完整性、可靠性和正确程度。
三、 现况研究的特点和种类
(一)特点
1、现况调查开始时一般不设有对照组。
在其开始时,根据研究的目的来确定研究的对象,然后查明该研究对象中每个人在某一特定时点上的暴露(特征)和疾病的状态,并对其进行比较。
2、有特定时点或时期。
现况研究是调查某一特定时点上或时期内某一群体中暴露和疾病的状况或联系。
3、在确定因果联系时受到限制。
一般而言,现况研究所揭示的暴露与疾病之间的统计学联系,仅为建立因果联系提供线索,而不能以此作因果推论。
原因:(1)现况调查多为存活期长的病人,这是很可能会混淆影响存活的因素和影响发病的因素。(2)现况调查揭示的是某时点暴露与疾病的关系,但不能决定两者的时间顺序关系。
4、对不会发生改变的暴露因素,可以作因果推论。 如性别、种族、血型等因素。
5、定期重复进行可获得发病率资料。
(二)种类
1.普查(census)
普查——指在特定时点或时期、特定范围内的全部人群(总体)均为研究对象的调查。
目的:了解某病的患病率或某人群的健康状况,疾病的早期发现和诊断。
要求:(1)特定时间应该较短,一般为1-2天或1-2周,大规模普查也不要超过2-3个月。
(2)多用于患病率较高的疾病,且比较简易而
准确的检测手段与方法。并对该病有较好的治疗方法。
(3)人力、物力和设备条件要有保证。
优缺点:
优点:早发现、早诊断,没有抽样误差,易于普及医学卫生知识。
缺点:①工作量大而有可能影响诊断的准确性;②如果人力物力不足会影响检查的速度与精确性;③不适用于患病率低、无简便易行诊断手段的疾病;④普查的费用往往较大。
2.抽样调查(sampling survey)
抽样调查——指通过随机抽样的方法,对特定时点、特定范围内人群的一个代表性样本的调查,即通过样本中的调查结果来推论其所在总体的情况。
目的:描述疾病在时间、空间和人群特征上的分布及影响因素;衡量群体的卫生水平;检查与衡量资料的质量。
要求:(1)要遵循随机化和样本量适当的原则;(2)避免由系统误差而引起偏倚。
优缺点:
优点:节省时间、人力和物力,调查范围小。工作容易做的细致。适用于发病率较高的疾病。
缺点:调查的设计、实施与资料分析复杂;重复或遗漏不易被发现;且不适用调查变异较大的资料。
第一节 现况研究的设计与实施
一、 明确调查的目的和类型
根据研究所提出的问题,明确该次调查所要达到的目的,再根据目的来确定采用的方法。
二、 确定研究对象
根据研究目的和实际情况来选择研究对象。(1)如果是普查,研究对象可规定为某个区域内的全部或部分居民。
(2)如果是抽样调查,首先要明确总体是什么,然后再明确采用的方法和样本数。
三、 样本含量和抽样方法
(一)样本含量
1、样本量的决定因素
①预期的现患率(P),如现患率低,则样本量要大;反之,则可小些。
②精确度,即允许误差(d),精确度越高,允许误差越小,所需样本就越大;反之,则样本量不必过大。
2、样本量的计算公式
(1)调查率时:
设N=样本数,P=估计现患率,Q=1-P,样本的现患率p与总体现患率P之间的差异为d。
则P-p=±d
当允许误差d=0.1P时,则N=400Q/P
当允许误差d=0.15P时,则N=178Q/P
(2)调查均数时:
N=(Uασ/δ)2
N=所需样本数,Uα=正态分布中自左至右的累积概率,σ=标准差,δ=允许误差。
当α取0.05时,S为样本的预期标准差,d为允许误差,则N=4S2/d2
如从有限总体中抽样则按公式校正计算样本含量ncnc=n/(1+n/N)
(二)抽样方法
抽样分为非随机抽样(典型调查)和随机抽样。随机抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样。 随机抽样要求遵循随机化原则,即得到总体中每一个对象都有同等机会被选入作为研究对象,以保证样本的代表性。
1、单纯随机抽样
单纯随机抽样也称简单随机抽样,是从总体N个对象中,利用抽签或其他随机方法(如随机数字)抽取n个,构成一个样本。
2、系统抽样
系统抽样又称机械抽样,是按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。
方法:设总体单位数为N,需要调查的样本数为n,则抽样比为n/N,抽样间隔为K=N/n。将每K个单位为一组,然后用随机方法确定每一组的单位号(1,2,3,···,K),最后每隔K个单位抽取一个作为研究对象。
优点:①事先不需要知道总体内的单位数,可以根据估计而确定抽样间隔(K);
②在人群现场易操作;
③分布比较均匀,代表性较好。
缺点:假如总体各单位的分布有周期性趋势,而抽取的间隔恰好是其周期,则可能产生偏性,会使结果产生偏倚。
3、分层抽样
分层抽样是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行随机随机抽样。
其抽样误差小,代表性好。
4、整群抽样
整群抽样是将总体分成若干群组,抽取其中部分群组作为观察单位组成样本的抽样方法。若被抽到的群组中的全部个体均作为调查对象,称为单纯整群抽样(simple cluster sampling);若调查部分个体,称为二阶段抽样(two stages sampling)。
优点:①易于组织、实施方便,可以节省人力、物力;②如群间差异越小,抽取的群越多,则精密度越好;
缺点:抽样误差较大,故样本量比其他方法要增加1/2。
5、多级抽样
多级抽样是将上述方法综合运用的方法,多用于大型流行病学调查。
先从总体中抽取范围较大的单元,称为一级抽样单位(如省),再从每个抽得的一级单元中抽取范围较小的二级单
元(县),依次类推,最后抽取其中范围更小的单元(如村)作为调查单位。
优点:可以充分利用各种抽样方法的优势,克服各自的不足,并能节省人力、物力。
缺点:在抽样之前要掌握各级调查单位的人口资料及特点。
四、 确定收集资料的方法
收集资料的方法一经确定,就不应变更。一般有两种方法:一是通过测定或检查的方法,如测定血压是否正常等。另一是通过直接用调查表询问研究对象,让其回答或回忆暴露或疾病的情况。
资料的收集过程中,要明确和统一暴露(特征)的规定(定义)和疾病的标准。
五、 现况调查中常见的偏倚与质量控制
(一) 常见的偏倚
偏倚——是指在流行病学研究中,从研究设计到实施,资料分析的结果解释存在的系统误差。
系统误差——指由于研究设计、实施、分析的不当,而导致结果与真实不符的现象。
1、 选择偏倚
选择偏倚——是指选择出的研究对象或样本人群与其代表的总体间的某些特征具有系统误差。包括无应答偏倚、
幸存者偏倚和志愿者偏倚。
2、 信息偏倚
信息偏倚——是指由于观察和测量方法上有缺陷,使各比较组所获得的信息产生系统误差。又称为观察偏倚或测量偏倚。包括回忆偏倚、报告偏倚和观察者偏倚。
(二) 质量控制
为减少各种偏倚的产生,在具体操作时应注意:
1.严格遵照抽样方法的要求,确保抽样过程的随机化原则的完全实施;
2.提高研究对象的依从性和受检率;
3.正确选择测量工具和检测方法;
4.健全研究组织和网络,调查员一定要经过培训,统一标准和认识;
5.做好资料的复查、复核等工作;
6.选择正确的统计分析方法,注意辨析混杂因素及其影响。
六、 调查表和调查员
(一)调查表编制方法
调查表是研究者根据研究目的,将研究内容具体化,以一系列问题的形式提出来的一种表格,是收集研究所需要资料的工具。
调查表中的问题应反映全部的研究内容。
注意问题:
1、调查表中各问题之间的逻辑性和连贯性。
2、被调查者的心理状态。
3、尽量避免使用专业术语和使被调查者反感或难堪的问题。
4、问题不能带有导向性。
另外,在正式调查之前需要进行预调查,以确定调查的可行性,及时修正调查表。
(二)调查项目(变量)的规定
1、定义研究因素:对研究的任何一个因素或变量,都应有明确的定义。
2、明确诊断标准。
3、设定测量尺度。
(三)调查员
1、必须经过培训,能够掌握诸标准。
2、必须要有实事求是的科学态度,无偏见,不造假。
3、必须具有责任感,能对调查资料保密。
4、必须保持中立的态度,不可有任何形式的暗示或导向性语句或示意。
(四)知情同意(informed consent)
知情同意是指在调查前向调查对象说明该调查的目的、时间、资料的用途和保密等,得到理解、认可和同意。
七、 现况调查的资料分析
以Ferris和Anderson(1962)所进行的一个关于慢性呼吸道疾病与吸烟、空气污染的现况研究资料为例(详见教材)。
复习思考题:
1、 什么叫现况调查?它有何作用?包括哪几种类型?
2、 什么叫随机化抽样?医学研究中常见的抽样方法有哪些?