卫生统计学考试复习题及参考答案

2007级预防医学-卫生统计学考试复习题及参考答案

一 名词解释

1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计

量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。

2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count

data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类

别或属性。

3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位

数,称为等级资料(ordinal data)。等级资料又称有序变量。

4.

5.

6. 总体:总体(population)指特定研究对象中所有观察单位的测量值。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。 抽样误差:抽样误差(sampling error)是指样本统计量与总体参数的差别。在总体确

定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

7.

8. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。 算术均数:描述一组数据在数量上的平均水平。总体均数用表示,样本均数用X表

示。

9. 中位数:将一组观察值由小到大排列,位次居中的那个数。

10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定

性较差。

11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,

大样本、小样本均可,最为常用。

13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14. 正态分布:若资料X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。

通常用记号N(,)表示均数为,标准差为的正态分布。

15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2

N(0,12)。

16. 统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称

为统计推断。

17. 抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为

抽样误差。

18. 标准误:通常将样本统计量的标准差称为标准误。

19. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。

20. 参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。

21. 假设检验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有

样本获得的检验统计量值的概率。

22. I型和II型错误:I型错误指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错

误,其概率大小用表示;II型错误,指接受了实际上不成立的H0,这类“存伪”的

错误称为II型错误,其概率大小用表示。

23. 检验效能:1-称为检验效能,它是指当两总体确有差别,按规定的检验水准所能

发现该差异的能力。

24. 检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时

犯错误的概率称为检验水准,记为。

25. 方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平

方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个

因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均

方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。

26. 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受

试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区

组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。

27. 相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数

有率、构成比、相对比。

28. 标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。标准化法的基本

思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”

计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来

的影响。

29. 二项分布:若一个随机变量X,它的可能取值是0,1,…,n,且相应的取值概率为

knkP(Xk)(n, 则称此随机变量X服从以n、为参数的二项分布。 k)(1)

30. Yates校正:英国统计学家Yates F认为,由于2分布理论上是一连续性分布,而分类

资料是间断性的,由此计算出的2值不连续,尤其是自由度为1的四格表,求出的概

率P值可能偏小,此时需对2值作连续性校正(correction of continuity),这一校正即

所谓的Yates校正(Yates’ correction)。

31. 非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分

布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需

要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限

制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free

statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计

分析方法。

32. 直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直

线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称

简单回归。

33. 直线相关:是用来描述具有直线关系的两变量x、y间的相互关系。

34. 相关系数:又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。

它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。

35. 回归系数: 为直线的斜率,其统计学意义是自变量x改变一个单位时,应变量y平均

变化b个单位。

36. 人口总数:人口总数(population)是指一个国家或地区在某特定时间点上存活人口的总

和。国际上统计人口数有两种办法:① 实际制(de facto):即只统计标准时刻某地实际

存在的人口数(包括临时在该地的人)。② 法定制(de jure):只统计某地的常住人口。

37. 老年人口系数:是指65岁及以上老年人口数占总人口数的比重。

老年人口系数65岁及以上的人口数

人口总数100% 。老年人口系数用于表明一个国

家或地区的人口老龄化程度,其大小受社会经济发展水平、生活水平、卫生保健水平

等因素的影响。

38. 围产儿死亡率:围产期是指胎儿体重达到1000克及以上、或孕期满28周,至出生后

7天以内的时期。在此期间的死亡称为围产儿死亡。计算式为:围产儿死亡率=同年围产期死胎数+死产数+出生7天内的新生儿死亡数

某年围产期死胎数+死产数+活产数1000% 。

围产儿死亡率是衡量孕期、产前、产后保健工作质量的敏感指标,它不能从出生报告及死亡报告直接计算,需要利用妇产科病例资料分析计算。

39. 新生儿死亡率:新生儿死亡率(neonatal mortality rate, NMR) 指某地平均每千名活产数

中未满28天的新生儿死亡数。计算式:

新生儿死亡率同年未满28天的新生儿死亡数

某年活产总数1000‰

新生儿死亡在婴儿死亡中占很大的比重。死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制的疾病。

40. 婴儿死亡率:指某年平均每千名活产中不满1周岁(婴儿)的死亡数。计算式为:

婴儿死亡率同年未满1岁婴儿死亡数

某年活产总数1000‰

41. 孕产妇死亡率:指某年由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活

产数之比,常以万分率或十万分率表示,计算式为:

孕产妇死亡率同年孕产妇死亡数

某年活产数 10000(或10万)

42. 死因顺位:指按各类死因构成比从高到低排列的位次,说明死因的重要性,反映了各

种死亡原因导致死亡的严重程度。

43. 人口金字塔:将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人口数或

年龄构成比为横轴,按男左女右绘制的直方图,其形态如金字塔,故称为人口金字塔。人口金字塔是对人口年龄、性别构成综合反映的特殊统计图,指示了不同时期人口年龄、性别构成的变化情况,是长期人口出生、死亡、迁入、迁出而形成的,反映了历史的痕迹和变动的趋势。

44. 灵敏度:是诊断试验将实际有病的人正确诊断为病人的百分率。

45. 特异度:是诊断试验将实际无病的人正确诊断为非病人的百分率。

46. 误诊率:是诊断试验将实际无病的人错误诊断为病人的百分率。

47. 漏诊率:是诊断试验将实际有病的人错误诊断为非病人的百分率。

48. 阳性似然比:是诊断试验中灵敏度与误诊率的比值,即正确判定病人的概率是错判病

人概率的倍数,它反映诊断试验判断正确的概率程度。LR+的取值范围为(0,∞),其值越大则该试验确诊疾病能力越强。

49. 阴性似然比:是诊断试验中漏诊率与特异度的比值,即错判非病人的概率是正确判定

非病人概率的倍数,它反映诊断试验判断错误的概率程度,LR-的取值范围为(0,∞),其值越小则该试验排除疾病的能力越好。

50. Youden指数:是诊断试验中灵敏度和特异度之和减去基数(1或100%),表示诊断试验

发现真正的患者和非患者的总的能力。Youden指数的取值范围在(-1,1)之间,其值越接近1,诊断价值越大。

51. ROC曲线:即受试者工作特征曲线,是确定临界点较为理想的一种方法。它是以不同

临界点的同一种试验连续(至少5组)测定的灵敏度为纵坐标,1-特异度(误诊率)为横坐标,标出各工作点,然后将得到的多个工作点连接绘制而成的曲线,

52. 统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或

面积的大小等形式直观的表示事物间的数量关系。

1.D

6.B

11.D

16.C

21.B

26.D

二、单项选择题

1.观察单位为研究中的( )。

A.样本 B. 全部对象

C.影响因素 D. 个体

2.总体是由( )。

A.个体组成 B. 研究对象组成

C.同质个体组成 D. 研究指标组成

3.抽样的目的是( )。

A.研究样本统计量 B. 由样本统计量推断总体参数

C.研究典型案例研究误差 D. 研究总体统计量

4.参数是指( )。

A.参与个体数 B. 总体的统计指标

2.C 7.A 12.B 17.D 22.D 27.D 3.B 8.D 13.D 18.A 23.B 28.A 4.B 9.C 14.D 19.A 24.B 29.C 5.A 10.C 15.D 20.C 25.D 30.B

C.样本的统计指标 D. 样本的总和

5.关于随机抽样,下列那一项说法是正确的( )。

A.抽样时应使得总体中的每一个个体都有同等的机会被抽取

B.研究者在抽样时应精心挑选个体,以使样本更能代表总体

C.随机抽样即随意抽取个体

D.为确保样本具有更好的代表性,样本量应越大越好

6.各观察值均加(或减)同一数后( )。

A.均数不变,标准差改变 B.均数改变,标准差不变

C.两者均不变 D.两者均改变

7.比较身高和体重两组数据变异度大小宜采用( )。

A.变异系数 B.方差

C.极差 D.标准差

8.以下指标中( )可用来描述计量资料的离散程度。

A.算术均数 B.几何均数

C.中位数 D.标准差

9.血清学滴度资料最常用来表示其平均水平的指标是( )。

A.算术平均数 B.中位数

C.几何均数 D.平均数

10.两样本均数的比较,可用( )。

A.方差分析 B.t检验

C.两者均可 D.方差齐性检验

11.配伍组设计的方差分析中,

A.总-

C.总-误差

处理配伍等于( )。 处理 B.误差+-- D.总

总 -误差处理

|( )的概率为5%。12.在均数为,标准差为的正态总体中随机抽样,|

A.1.96 B.1.96 C.t0.052,s D. t0.052,S

13.完全随机设计方差分析的检验假设是( )。

A.各处理组样本均数相等 B.各处理组总体均数相等

C.各处理组样本均数不相等 D.各处理组总体均数不全相等

14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女

多于男,而乙乡男多于女,适当的比较方法是( )。

A.分别进行比较 B.两个率比较的χ2检验

C.不具备可比性,不能比较 D.对性别进行标准化后再比较

15.率的标准误的计算公式是( )。

A.p(1p) B.p(1p) C.p

nn D.p(1p)

1n

16.非参数统计应用条件是( )。

A.总体是正态分布

B.若两组比较,要求两组的总体方差相等

C.不依赖于总体分布

D.要求样本例数很大

17.下述哪些不是非参数统计的特点( )。

A.不受总体分布的限定 B.多数非参数统计方法简单,易于掌握

C.适用于等级资料 D.检验效能总是低于参数检验

18.设配对设计资料的变量值为X1和X2,则配对资料的秩和检验( )。

A.把X1与X2的差数绝对值从小到大编秩

B.把X1和X2综合从小到大编秩

C.把X1和X2综合按绝对值从小到大编秩

D.把X1与X2的差数从小到大编秩

19.秩和检验和t检验相比,其优点是( )。

A.计算简便,不受分布限制 B.公式更为合理

C.检验效能高 D.抽样误差小

20.对两样本均数作比较时,已知n1、n2均小于30,总体方差不齐且分布呈偏态,宜用(

A.t检验 B.u检验

C.秩和检验 D.F检验

21.等级资料的比较宜用( )。

A.t检验 B.秩和检验

C.F检验 D.四格表X2检验

22.两个小样本比较的假设检验,应首先考虑( )。

A.t检验 B.秩和检验

C.任选一种检验方法 D.资料符合哪种检验的条件

。 )

23.对于配对比较的秩和检验,其检验假设为( )。

A.样本的差数应来自均数为0的正态总体

B.样本的差数应来自均数为0的非正态总体

C.样本的差数来自中位数为0的总体

D.样本的差数来自方差齐性和正态分布的总体

24.用最小二乘法确定直线回归方程的原则是各观察点( )。

A.距直线的纵向距离相等

B.距直线的纵向距离的平方和最小

C.与直线的垂直距离相等

D.与直线的垂直距离的平方和最小

25.实验设计的三个基本要素是( )。

A. 受试对象、实验效应、观察指标 B. 随机化、重复、设置对照

C. 齐同对比、均衡性、随机化 D. 处理因素、受试对象、实验效应

26.实验设计的基本原则( )。

A. 随机化、盲法、设置对照 B. 重复、随机化、配对

C. 随机化、盲法、配对 D. 随机化、重复、设置对照

27. 实验设计和调查设计的根本区别是( )。

A.实验设计以动物为对象 B.调查设计以人为对象

C.实验设计可随机分组 D.实验设计可人为设置处理因素

28. 标准正态分布的均数与标准差分别为( )。

A.0与1 B.1与0 C.0与0 D.1与1

29.正态分布有两个参数与,( )相应的正态曲线的形状越扁平。

A.越大 B.越小 C.越大 D.越小

30.若X服从以,为均数和标准差的正态分布,则X的第95百分位数等于( )。

A.1.64 B.1.64 C.1.96 D.2.58

三、简答题

1. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。

如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么? 不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。既使是按随机

化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。

2. 简述医学中参考值范围的涵义及制定参考值范围的一般步骤。

医学中常把绝大多数正常人的某资料范围称为该资料的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究资料的疾病和有关因素的同质人群。制定参考值范围的一般步骤:

(1)定义“正常人”,不同的资料“正常人”的定义也不同。

(2)选定足够数量的正常人作为研究对象。

(3)用统一和准确的方法测定相应的资料。

(4)根据不同的用途选定适当的百分界限,常用95%。

(5)根据此资料的实际意义,决定用单侧范围还是双侧范围。

(6)根据此资料的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。

3. 假设检验时,当P0.05,则拒绝H0,理论依据是什么?

P值系由H0所规定的总体做随机抽样,获得等于及大于(或等于及小于)依据现有样本信息所计算得的检验统计量的概率。当P0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于,也就是说,有了概率保证。

4. t检验和方差分析的应用条件?

t检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。

5. 应用相对数时应注意哪些问题?

应用相对数时应注意的事项有:

⑴ 计算相对数的分母一般不宜过小。

⑵ 分析时不能以构成比代替率。

⑶ 不能用构成比的动态分析代替率的动态分析。

⑷ 对观察单位数不等的几个率,不能直接相加求其总率。

⑸ 在比较相对数时应注意可比性。

⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验。

6. 为什么不能以构成比代率?请联系实际加以说明。

率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。

7. 应用直线回归和相关分析时应注意哪些问题?

注意以下五个问题

⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。

⑵在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。

⑶直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。

⑷双变量的小样本经t检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。

⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。

8. 统计表有哪些要素构成?制表的注意事项有哪些?

一般说来,统计表由标题、标目、线条、数字四部分构成(有时附有备注)。编制统计表的注意事项:

(1) 标题概括表的内容,写于表的上方,通常需注明时间与地点。

(2) 标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚。

(3) 线条不宜过多,通常采用三条半线表示,即顶线、底线、纵标目下的横隔线及合计上的半条线。

(4) 表内一律采用阿拉伯数字。同一指标小数点位数要一致,数次要对齐。表内不留空格。

(5) 备注不要列于表内,如有必要,可在表内用“ * ”号标记,并在表外加以说明。

9. 调查设计包含哪些内容?

一个完整的调查设计应包括以下内容:确定明确的调查目的;确定调查对象和观察单位;确定调查方法;确定调查指标和变量;确定调查工具和设计调查表;确定样本含量;调查员的选择和培训;调查的组织计划;涉及伦理道德方面问题的处理。 10. 实验设计的基本内容和步骤。

(1)建立研究假设:在选题时应当考虑题目的科学性、新颖性、可行性以及所选课题是否是当前社会需要解决的主要问题。根据研究目的确定本研究需要解决的主要问题及相应的辅助问题。

(2)明确研究范围:审慎考虑规定适当的纳入标准和排除标准,选择适宜本次实验的受试对象。

(3)确立处理因素:分清处理因素和非处理因素,并注意处理因素的标准化。 (4)明确观察指标:选用客观性较强,易于量化,灵敏性和特异性均较高的指标。 (5)控制误差和偏倚:采取各种有效措施控制误差(error)和偏倚(bias),使处理措施的效果能够真正的体现出来。

11. 诊断试验的设计主要包括哪些程序和内容?

(1)确定金标准:诊断试验的金标准是指目前公认的最可靠、最准确、最好的诊断方法,也称标准诊断方法,用来衡量新的诊断试验是否符合真实情况。临床上常用的金标准有组织病理学检查(活检、尸检)、手术发现、影像诊断(CT、核磁共振、彩色B超)、细菌培养以及长期随访所得的结论。(2)选择研究对象:诊断试验的研究对象应包括两组:一组是用金标准确定为有某病的病例组,另一组是用金标准证实为无该病的患者或人群,作为对照组。病例组应包括各种病例,如症状典型和非典型的,病程早、中、晚期的,病情轻、中、重型的,年龄不同层次的等,以便能反映该病的全部特征。对照组应包括确实无本病而患有易与本病相混淆疾病的病例,这样的对照才具有临床鉴别诊断价值。(3)同步盲法测试:经金标准确定的病例与对照两组中的受试者同步接受新诊断试验方法的测定,将测定结果与金标准判定的结果进行比较,计算新诊断试验与金标准符合和差异程度的统计学指标,再根据这些指标对新诊断试验进行评价。在试验操作的全过程和判定试验结果时,采用盲法(尽可能用双盲法)是保证诊断试验结果真实可靠的关键,即观察者(和受试者)不能预先知道何为金标准确定的病例或对照,以免发生人为偏差,过高或过低估计新诊断试验与金标准的符合程度。 四、分析计算题

1. 假定正常成年女性红细胞数(10

12

/L)近似服从均值为4.18,标准差为0.29的正

态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:(1)变量X落在区间(4.00,4.50)内的概率;(2)正常成年女性的红细胞数95%参考值范围。

解:

(1)根据题意,变量X近似服从正态分布,求变量X落在区间(4.00,4.50)内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量X进行标准化变换后,借助标准正态分布表求其面积,具体做法如下: P(4.00X4.50)P(

4.004.180.29

X

4.504.180.29

)

P(0.62u1.10) 1(1.10)(0.62) 10.13570.2676 0.5967 变量X落在区间(4.00,4.50)内的概率为0.5967。

(2)因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该资料过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:

下限为:X1.964.181.96(0.29)3.61(10

12

/L) /L)

12

上限为:X1.964.181.96(0.29)4.75(10

12

95%的正常成年女性红细胞数所在的范围是3.61~4.75(10/L)

2.某医生研究脑缺氧对脑组织中生化指标的影响,将出生状况相近的乳猪按出生体重配成7对;随机接受两种处理,一组设为对照组,一组设为脑缺氧模型组,实验结果见表1第(1)、(2)、(3)栏。试比较两组猪脑组织钙泵的含量有无差别。

表1 两组乳猪脑组织钙泵含量( g/g)

乳猪号

(1) 1 2 3 4 5 6

对照组 (2) 0.3550 0.2000 0.3130 0.3630 0.3544 0.3450

试验组 (3) 0.2755 0.2545 0.1800 0.3230 0.3113 0.2955

差值d (4)=(2)-(3) 0.0795 -0.0545 0.1330 0.0400 0.0431 0.0495

7 0.3050

0.2870

0.0180 解:本例属异体配对设计,所得数据为配对计量资料,用配对t检验进行处理。 (1)建立检验假设,确定检验水准 H0:d=0 H1:d≠0

 =0.05。

(2)计算检验统计量

n=7,ddn0.70.0441(g/g)

Sd

d

d2

d2

n1

0.05716(g/g)

t

Sd

n

0.04410.7

2.0412

(3)确定P值,作出推断结论

按= n-1=7-1=6查t界值表,得t0.025,6=2.447,t0.05,按 =0.05水准不拒绝H0,差别无统计学意义,即按现有样本不足以说明脑缺氧乳猪钙泵平均含量与对照组不同。

3.某医院比较几种疗法对慢性胃炎病人的疗效:单纯西药组治疗79例,有效63例;单纯中药组治疗54例,有效47例;中西医结合组治疗68例,有效65例。问:①该资料属何种资料?实验设计属何种设计?②欲比较3种疗法的疗效的差别,宜选用何种假设检验方法?③写出该种检验方法的H0与H1;④若求得的检验统计量为8.143,相应于0.05的检验统计量的临界值为5.99,你如何做出结论?⑤根据你的结论,你可能犯哪一类统计错误?

解:

① 该资料属计数资料,实验设计属完全随机设计; ② 宜选用R×C表的检验方法; ③ H0:3种疗法的总体有效率相等

2

H1:3种疗法的总体有效率不全相等

④ 在0.05的水准上,拒绝H0,接受H1,差别有统计学意义,可认为3种疗法的总体有效率不全相等,即3种疗法对慢性胃炎病人的疗效有差别。 可能犯I型错误。

4.为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为40%以上者为治疗有效。问:(1) 如何将病人分组?(2) 如何对结果进行统计分析处理?

解:(1) 根据题意,该设计为配对设计,首先将20例病人按年龄、性别、病型和病情等条件进行配对后,将10对患者从1到10编号,再任意指定随机排列表中的任一行,比如第8行,舍去10~20,将随机数排列如下,规定逢单数者每对中的第1号试验对象进入胃舒氨组(A),第2号对象进入西米替丁组(B),逢双数者则相反。分组情况如下所示:

表1 20例病人配对入组情况

病 人 号 随机数字 入组情况

1.1 1.2 3 A B

2.1 2.2 2 B A

3.1 3.2 6 B A

4.1 4.2 1 A B

5.1 5.2 8 B A

6.1 6.2 0 B A

7.1 7.2 9 A B

8.1 8.2 5 A B

9.1 9.2 4 B A

10.1 10.2 7 A B

(2) 首先以溃疡面积减少百分率40%为界限,将每位患者的治疗情况分为有效和无效两类,并整理成配对四格表的形式(见表2)。本试验的目的在于比较胃舒氨与西米替丁治疗消化性胃溃疡有效率的差别,故选用配对四格表的McNemar检验进行统计分析。

表2 20位患者治疗情况

胃舒氨

西米替丁

有效

有效 无效 合 计

a c a+c

无效 b d b+d

a+b c+d N 合计

5.试就表2资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。

表2 甲、乙两医院乳腺癌手术后的5年生存率(%)

腋下淋巴结 转 移

甲 医 院

病例数

生存数

生存率

病例数

乙 医 院 生存数

生存率

无 有 合计

45 710 755

35 450 485

77.77 68.38 64.24

300 83 383

215 42 257

71.67 50.60 67.10

表3 甲、乙两医院乳腺癌手术后的5年生存率的标化(以甲乙两医院合计为标准) 腋下淋巴结转移

⑴ 无 有 合计

标准 病例数 Ni ⑵ 345 793 1138(∑Ni)

甲 医 院

原生存率

pi ⑶ 77.77 68.38 64.24

预期生存人数

Nipi ⑷=⑵⑶

268 503 771(∑Nipi)

乙 医 院

原生存率

Pi ⑸ 71.67 50.60 67.10

预期生存人数

Nipi ⑹=⑵⑸

247 401 648(∑Nipi)

甲医院乳腺癌手术后的5年生存率的标化生存率: 'NiPi771p100%100%67.75% N1138

乙医院乳腺癌手术后的五年生存率标化生存率: 'NiPi648p100%100%56.94% N1138

因为甲、乙两医院有无腋下淋巴结转移的病情构成不同,故标化后,甲医院乳腺癌手术后的5年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。

6.某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116(mg/L),血铅均数为1.81(mg/L)。服用果胶20天后再测,尿铅均数降为0.087(mg/L),血铅均数降为0.73(mg/L),说明果胶驱铅的效果较好。请评述以上研究。

人体有自行排铅的功能,应设对照组,并进行假设检验后才能下结论。

2007级预防医学-卫生统计学考试复习题及参考答案

一 名词解释

1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计

量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。

2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count

data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类

别或属性。

3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位

数,称为等级资料(ordinal data)。等级资料又称有序变量。

4.

5.

6. 总体:总体(population)指特定研究对象中所有观察单位的测量值。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。 抽样误差:抽样误差(sampling error)是指样本统计量与总体参数的差别。在总体确

定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

7.

8. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。 算术均数:描述一组数据在数量上的平均水平。总体均数用表示,样本均数用X表

示。

9. 中位数:将一组观察值由小到大排列,位次居中的那个数。

10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定

性较差。

11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,

大样本、小样本均可,最为常用。

13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14. 正态分布:若资料X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。

通常用记号N(,)表示均数为,标准差为的正态分布。

15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2

N(0,12)。

16. 统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称

为统计推断。

17. 抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为

抽样误差。

18. 标准误:通常将样本统计量的标准差称为标准误。

19. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。

20. 参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。

21. 假设检验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有

样本获得的检验统计量值的概率。

22. I型和II型错误:I型错误指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错

误,其概率大小用表示;II型错误,指接受了实际上不成立的H0,这类“存伪”的

错误称为II型错误,其概率大小用表示。

23. 检验效能:1-称为检验效能,它是指当两总体确有差别,按规定的检验水准所能

发现该差异的能力。

24. 检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时

犯错误的概率称为检验水准,记为。

25. 方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平

方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个

因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均

方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。

26. 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受

试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区

组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。

27. 相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数

有率、构成比、相对比。

28. 标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。标准化法的基本

思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”

计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来

的影响。

29. 二项分布:若一个随机变量X,它的可能取值是0,1,…,n,且相应的取值概率为

knkP(Xk)(n, 则称此随机变量X服从以n、为参数的二项分布。 k)(1)

30. Yates校正:英国统计学家Yates F认为,由于2分布理论上是一连续性分布,而分类

资料是间断性的,由此计算出的2值不连续,尤其是自由度为1的四格表,求出的概

率P值可能偏小,此时需对2值作连续性校正(correction of continuity),这一校正即

所谓的Yates校正(Yates’ correction)。

31. 非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分

布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需

要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限

制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free

statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计

分析方法。

32. 直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直

线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称

简单回归。

33. 直线相关:是用来描述具有直线关系的两变量x、y间的相互关系。

34. 相关系数:又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。

它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。

35. 回归系数: 为直线的斜率,其统计学意义是自变量x改变一个单位时,应变量y平均

变化b个单位。

36. 人口总数:人口总数(population)是指一个国家或地区在某特定时间点上存活人口的总

和。国际上统计人口数有两种办法:① 实际制(de facto):即只统计标准时刻某地实际

存在的人口数(包括临时在该地的人)。② 法定制(de jure):只统计某地的常住人口。

37. 老年人口系数:是指65岁及以上老年人口数占总人口数的比重。

老年人口系数65岁及以上的人口数

人口总数100% 。老年人口系数用于表明一个国

家或地区的人口老龄化程度,其大小受社会经济发展水平、生活水平、卫生保健水平

等因素的影响。

38. 围产儿死亡率:围产期是指胎儿体重达到1000克及以上、或孕期满28周,至出生后

7天以内的时期。在此期间的死亡称为围产儿死亡。计算式为:围产儿死亡率=同年围产期死胎数+死产数+出生7天内的新生儿死亡数

某年围产期死胎数+死产数+活产数1000% 。

围产儿死亡率是衡量孕期、产前、产后保健工作质量的敏感指标,它不能从出生报告及死亡报告直接计算,需要利用妇产科病例资料分析计算。

39. 新生儿死亡率:新生儿死亡率(neonatal mortality rate, NMR) 指某地平均每千名活产数

中未满28天的新生儿死亡数。计算式:

新生儿死亡率同年未满28天的新生儿死亡数

某年活产总数1000‰

新生儿死亡在婴儿死亡中占很大的比重。死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制的疾病。

40. 婴儿死亡率:指某年平均每千名活产中不满1周岁(婴儿)的死亡数。计算式为:

婴儿死亡率同年未满1岁婴儿死亡数

某年活产总数1000‰

41. 孕产妇死亡率:指某年由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活

产数之比,常以万分率或十万分率表示,计算式为:

孕产妇死亡率同年孕产妇死亡数

某年活产数 10000(或10万)

42. 死因顺位:指按各类死因构成比从高到低排列的位次,说明死因的重要性,反映了各

种死亡原因导致死亡的严重程度。

43. 人口金字塔:将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人口数或

年龄构成比为横轴,按男左女右绘制的直方图,其形态如金字塔,故称为人口金字塔。人口金字塔是对人口年龄、性别构成综合反映的特殊统计图,指示了不同时期人口年龄、性别构成的变化情况,是长期人口出生、死亡、迁入、迁出而形成的,反映了历史的痕迹和变动的趋势。

44. 灵敏度:是诊断试验将实际有病的人正确诊断为病人的百分率。

45. 特异度:是诊断试验将实际无病的人正确诊断为非病人的百分率。

46. 误诊率:是诊断试验将实际无病的人错误诊断为病人的百分率。

47. 漏诊率:是诊断试验将实际有病的人错误诊断为非病人的百分率。

48. 阳性似然比:是诊断试验中灵敏度与误诊率的比值,即正确判定病人的概率是错判病

人概率的倍数,它反映诊断试验判断正确的概率程度。LR+的取值范围为(0,∞),其值越大则该试验确诊疾病能力越强。

49. 阴性似然比:是诊断试验中漏诊率与特异度的比值,即错判非病人的概率是正确判定

非病人概率的倍数,它反映诊断试验判断错误的概率程度,LR-的取值范围为(0,∞),其值越小则该试验排除疾病的能力越好。

50. Youden指数:是诊断试验中灵敏度和特异度之和减去基数(1或100%),表示诊断试验

发现真正的患者和非患者的总的能力。Youden指数的取值范围在(-1,1)之间,其值越接近1,诊断价值越大。

51. ROC曲线:即受试者工作特征曲线,是确定临界点较为理想的一种方法。它是以不同

临界点的同一种试验连续(至少5组)测定的灵敏度为纵坐标,1-特异度(误诊率)为横坐标,标出各工作点,然后将得到的多个工作点连接绘制而成的曲线,

52. 统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或

面积的大小等形式直观的表示事物间的数量关系。

1.D

6.B

11.D

16.C

21.B

26.D

二、单项选择题

1.观察单位为研究中的( )。

A.样本 B. 全部对象

C.影响因素 D. 个体

2.总体是由( )。

A.个体组成 B. 研究对象组成

C.同质个体组成 D. 研究指标组成

3.抽样的目的是( )。

A.研究样本统计量 B. 由样本统计量推断总体参数

C.研究典型案例研究误差 D. 研究总体统计量

4.参数是指( )。

A.参与个体数 B. 总体的统计指标

2.C 7.A 12.B 17.D 22.D 27.D 3.B 8.D 13.D 18.A 23.B 28.A 4.B 9.C 14.D 19.A 24.B 29.C 5.A 10.C 15.D 20.C 25.D 30.B

C.样本的统计指标 D. 样本的总和

5.关于随机抽样,下列那一项说法是正确的( )。

A.抽样时应使得总体中的每一个个体都有同等的机会被抽取

B.研究者在抽样时应精心挑选个体,以使样本更能代表总体

C.随机抽样即随意抽取个体

D.为确保样本具有更好的代表性,样本量应越大越好

6.各观察值均加(或减)同一数后( )。

A.均数不变,标准差改变 B.均数改变,标准差不变

C.两者均不变 D.两者均改变

7.比较身高和体重两组数据变异度大小宜采用( )。

A.变异系数 B.方差

C.极差 D.标准差

8.以下指标中( )可用来描述计量资料的离散程度。

A.算术均数 B.几何均数

C.中位数 D.标准差

9.血清学滴度资料最常用来表示其平均水平的指标是( )。

A.算术平均数 B.中位数

C.几何均数 D.平均数

10.两样本均数的比较,可用( )。

A.方差分析 B.t检验

C.两者均可 D.方差齐性检验

11.配伍组设计的方差分析中,

A.总-

C.总-误差

处理配伍等于( )。 处理 B.误差+-- D.总

总 -误差处理

|( )的概率为5%。12.在均数为,标准差为的正态总体中随机抽样,|

A.1.96 B.1.96 C.t0.052,s D. t0.052,S

13.完全随机设计方差分析的检验假设是( )。

A.各处理组样本均数相等 B.各处理组总体均数相等

C.各处理组样本均数不相等 D.各处理组总体均数不全相等

14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女

多于男,而乙乡男多于女,适当的比较方法是( )。

A.分别进行比较 B.两个率比较的χ2检验

C.不具备可比性,不能比较 D.对性别进行标准化后再比较

15.率的标准误的计算公式是( )。

A.p(1p) B.p(1p) C.p

nn D.p(1p)

1n

16.非参数统计应用条件是( )。

A.总体是正态分布

B.若两组比较,要求两组的总体方差相等

C.不依赖于总体分布

D.要求样本例数很大

17.下述哪些不是非参数统计的特点( )。

A.不受总体分布的限定 B.多数非参数统计方法简单,易于掌握

C.适用于等级资料 D.检验效能总是低于参数检验

18.设配对设计资料的变量值为X1和X2,则配对资料的秩和检验( )。

A.把X1与X2的差数绝对值从小到大编秩

B.把X1和X2综合从小到大编秩

C.把X1和X2综合按绝对值从小到大编秩

D.把X1与X2的差数从小到大编秩

19.秩和检验和t检验相比,其优点是( )。

A.计算简便,不受分布限制 B.公式更为合理

C.检验效能高 D.抽样误差小

20.对两样本均数作比较时,已知n1、n2均小于30,总体方差不齐且分布呈偏态,宜用(

A.t检验 B.u检验

C.秩和检验 D.F检验

21.等级资料的比较宜用( )。

A.t检验 B.秩和检验

C.F检验 D.四格表X2检验

22.两个小样本比较的假设检验,应首先考虑( )。

A.t检验 B.秩和检验

C.任选一种检验方法 D.资料符合哪种检验的条件

。 )

23.对于配对比较的秩和检验,其检验假设为( )。

A.样本的差数应来自均数为0的正态总体

B.样本的差数应来自均数为0的非正态总体

C.样本的差数来自中位数为0的总体

D.样本的差数来自方差齐性和正态分布的总体

24.用最小二乘法确定直线回归方程的原则是各观察点( )。

A.距直线的纵向距离相等

B.距直线的纵向距离的平方和最小

C.与直线的垂直距离相等

D.与直线的垂直距离的平方和最小

25.实验设计的三个基本要素是( )。

A. 受试对象、实验效应、观察指标 B. 随机化、重复、设置对照

C. 齐同对比、均衡性、随机化 D. 处理因素、受试对象、实验效应

26.实验设计的基本原则( )。

A. 随机化、盲法、设置对照 B. 重复、随机化、配对

C. 随机化、盲法、配对 D. 随机化、重复、设置对照

27. 实验设计和调查设计的根本区别是( )。

A.实验设计以动物为对象 B.调查设计以人为对象

C.实验设计可随机分组 D.实验设计可人为设置处理因素

28. 标准正态分布的均数与标准差分别为( )。

A.0与1 B.1与0 C.0与0 D.1与1

29.正态分布有两个参数与,( )相应的正态曲线的形状越扁平。

A.越大 B.越小 C.越大 D.越小

30.若X服从以,为均数和标准差的正态分布,则X的第95百分位数等于( )。

A.1.64 B.1.64 C.1.96 D.2.58

三、简答题

1. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。

如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么? 不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。既使是按随机

化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。

2. 简述医学中参考值范围的涵义及制定参考值范围的一般步骤。

医学中常把绝大多数正常人的某资料范围称为该资料的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究资料的疾病和有关因素的同质人群。制定参考值范围的一般步骤:

(1)定义“正常人”,不同的资料“正常人”的定义也不同。

(2)选定足够数量的正常人作为研究对象。

(3)用统一和准确的方法测定相应的资料。

(4)根据不同的用途选定适当的百分界限,常用95%。

(5)根据此资料的实际意义,决定用单侧范围还是双侧范围。

(6)根据此资料的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。

3. 假设检验时,当P0.05,则拒绝H0,理论依据是什么?

P值系由H0所规定的总体做随机抽样,获得等于及大于(或等于及小于)依据现有样本信息所计算得的检验统计量的概率。当P0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于,也就是说,有了概率保证。

4. t检验和方差分析的应用条件?

t检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。

5. 应用相对数时应注意哪些问题?

应用相对数时应注意的事项有:

⑴ 计算相对数的分母一般不宜过小。

⑵ 分析时不能以构成比代替率。

⑶ 不能用构成比的动态分析代替率的动态分析。

⑷ 对观察单位数不等的几个率,不能直接相加求其总率。

⑸ 在比较相对数时应注意可比性。

⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验。

6. 为什么不能以构成比代率?请联系实际加以说明。

率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。

7. 应用直线回归和相关分析时应注意哪些问题?

注意以下五个问题

⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。

⑵在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。

⑶直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。

⑷双变量的小样本经t检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。

⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。

8. 统计表有哪些要素构成?制表的注意事项有哪些?

一般说来,统计表由标题、标目、线条、数字四部分构成(有时附有备注)。编制统计表的注意事项:

(1) 标题概括表的内容,写于表的上方,通常需注明时间与地点。

(2) 标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚。

(3) 线条不宜过多,通常采用三条半线表示,即顶线、底线、纵标目下的横隔线及合计上的半条线。

(4) 表内一律采用阿拉伯数字。同一指标小数点位数要一致,数次要对齐。表内不留空格。

(5) 备注不要列于表内,如有必要,可在表内用“ * ”号标记,并在表外加以说明。

9. 调查设计包含哪些内容?

一个完整的调查设计应包括以下内容:确定明确的调查目的;确定调查对象和观察单位;确定调查方法;确定调查指标和变量;确定调查工具和设计调查表;确定样本含量;调查员的选择和培训;调查的组织计划;涉及伦理道德方面问题的处理。 10. 实验设计的基本内容和步骤。

(1)建立研究假设:在选题时应当考虑题目的科学性、新颖性、可行性以及所选课题是否是当前社会需要解决的主要问题。根据研究目的确定本研究需要解决的主要问题及相应的辅助问题。

(2)明确研究范围:审慎考虑规定适当的纳入标准和排除标准,选择适宜本次实验的受试对象。

(3)确立处理因素:分清处理因素和非处理因素,并注意处理因素的标准化。 (4)明确观察指标:选用客观性较强,易于量化,灵敏性和特异性均较高的指标。 (5)控制误差和偏倚:采取各种有效措施控制误差(error)和偏倚(bias),使处理措施的效果能够真正的体现出来。

11. 诊断试验的设计主要包括哪些程序和内容?

(1)确定金标准:诊断试验的金标准是指目前公认的最可靠、最准确、最好的诊断方法,也称标准诊断方法,用来衡量新的诊断试验是否符合真实情况。临床上常用的金标准有组织病理学检查(活检、尸检)、手术发现、影像诊断(CT、核磁共振、彩色B超)、细菌培养以及长期随访所得的结论。(2)选择研究对象:诊断试验的研究对象应包括两组:一组是用金标准确定为有某病的病例组,另一组是用金标准证实为无该病的患者或人群,作为对照组。病例组应包括各种病例,如症状典型和非典型的,病程早、中、晚期的,病情轻、中、重型的,年龄不同层次的等,以便能反映该病的全部特征。对照组应包括确实无本病而患有易与本病相混淆疾病的病例,这样的对照才具有临床鉴别诊断价值。(3)同步盲法测试:经金标准确定的病例与对照两组中的受试者同步接受新诊断试验方法的测定,将测定结果与金标准判定的结果进行比较,计算新诊断试验与金标准符合和差异程度的统计学指标,再根据这些指标对新诊断试验进行评价。在试验操作的全过程和判定试验结果时,采用盲法(尽可能用双盲法)是保证诊断试验结果真实可靠的关键,即观察者(和受试者)不能预先知道何为金标准确定的病例或对照,以免发生人为偏差,过高或过低估计新诊断试验与金标准的符合程度。 四、分析计算题

1. 假定正常成年女性红细胞数(10

12

/L)近似服从均值为4.18,标准差为0.29的正

态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:(1)变量X落在区间(4.00,4.50)内的概率;(2)正常成年女性的红细胞数95%参考值范围。

解:

(1)根据题意,变量X近似服从正态分布,求变量X落在区间(4.00,4.50)内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量X进行标准化变换后,借助标准正态分布表求其面积,具体做法如下: P(4.00X4.50)P(

4.004.180.29

X

4.504.180.29

)

P(0.62u1.10) 1(1.10)(0.62) 10.13570.2676 0.5967 变量X落在区间(4.00,4.50)内的概率为0.5967。

(2)因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该资料过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:

下限为:X1.964.181.96(0.29)3.61(10

12

/L) /L)

12

上限为:X1.964.181.96(0.29)4.75(10

12

95%的正常成年女性红细胞数所在的范围是3.61~4.75(10/L)

2.某医生研究脑缺氧对脑组织中生化指标的影响,将出生状况相近的乳猪按出生体重配成7对;随机接受两种处理,一组设为对照组,一组设为脑缺氧模型组,实验结果见表1第(1)、(2)、(3)栏。试比较两组猪脑组织钙泵的含量有无差别。

表1 两组乳猪脑组织钙泵含量( g/g)

乳猪号

(1) 1 2 3 4 5 6

对照组 (2) 0.3550 0.2000 0.3130 0.3630 0.3544 0.3450

试验组 (3) 0.2755 0.2545 0.1800 0.3230 0.3113 0.2955

差值d (4)=(2)-(3) 0.0795 -0.0545 0.1330 0.0400 0.0431 0.0495

7 0.3050

0.2870

0.0180 解:本例属异体配对设计,所得数据为配对计量资料,用配对t检验进行处理。 (1)建立检验假设,确定检验水准 H0:d=0 H1:d≠0

 =0.05。

(2)计算检验统计量

n=7,ddn0.70.0441(g/g)

Sd

d

d2

d2

n1

0.05716(g/g)

t

Sd

n

0.04410.7

2.0412

(3)确定P值,作出推断结论

按= n-1=7-1=6查t界值表,得t0.025,6=2.447,t0.05,按 =0.05水准不拒绝H0,差别无统计学意义,即按现有样本不足以说明脑缺氧乳猪钙泵平均含量与对照组不同。

3.某医院比较几种疗法对慢性胃炎病人的疗效:单纯西药组治疗79例,有效63例;单纯中药组治疗54例,有效47例;中西医结合组治疗68例,有效65例。问:①该资料属何种资料?实验设计属何种设计?②欲比较3种疗法的疗效的差别,宜选用何种假设检验方法?③写出该种检验方法的H0与H1;④若求得的检验统计量为8.143,相应于0.05的检验统计量的临界值为5.99,你如何做出结论?⑤根据你的结论,你可能犯哪一类统计错误?

解:

① 该资料属计数资料,实验设计属完全随机设计; ② 宜选用R×C表的检验方法; ③ H0:3种疗法的总体有效率相等

2

H1:3种疗法的总体有效率不全相等

④ 在0.05的水准上,拒绝H0,接受H1,差别有统计学意义,可认为3种疗法的总体有效率不全相等,即3种疗法对慢性胃炎病人的疗效有差别。 可能犯I型错误。

4.为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为40%以上者为治疗有效。问:(1) 如何将病人分组?(2) 如何对结果进行统计分析处理?

解:(1) 根据题意,该设计为配对设计,首先将20例病人按年龄、性别、病型和病情等条件进行配对后,将10对患者从1到10编号,再任意指定随机排列表中的任一行,比如第8行,舍去10~20,将随机数排列如下,规定逢单数者每对中的第1号试验对象进入胃舒氨组(A),第2号对象进入西米替丁组(B),逢双数者则相反。分组情况如下所示:

表1 20例病人配对入组情况

病 人 号 随机数字 入组情况

1.1 1.2 3 A B

2.1 2.2 2 B A

3.1 3.2 6 B A

4.1 4.2 1 A B

5.1 5.2 8 B A

6.1 6.2 0 B A

7.1 7.2 9 A B

8.1 8.2 5 A B

9.1 9.2 4 B A

10.1 10.2 7 A B

(2) 首先以溃疡面积减少百分率40%为界限,将每位患者的治疗情况分为有效和无效两类,并整理成配对四格表的形式(见表2)。本试验的目的在于比较胃舒氨与西米替丁治疗消化性胃溃疡有效率的差别,故选用配对四格表的McNemar检验进行统计分析。

表2 20位患者治疗情况

胃舒氨

西米替丁

有效

有效 无效 合 计

a c a+c

无效 b d b+d

a+b c+d N 合计

5.试就表2资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。

表2 甲、乙两医院乳腺癌手术后的5年生存率(%)

腋下淋巴结 转 移

甲 医 院

病例数

生存数

生存率

病例数

乙 医 院 生存数

生存率

无 有 合计

45 710 755

35 450 485

77.77 68.38 64.24

300 83 383

215 42 257

71.67 50.60 67.10

表3 甲、乙两医院乳腺癌手术后的5年生存率的标化(以甲乙两医院合计为标准) 腋下淋巴结转移

⑴ 无 有 合计

标准 病例数 Ni ⑵ 345 793 1138(∑Ni)

甲 医 院

原生存率

pi ⑶ 77.77 68.38 64.24

预期生存人数

Nipi ⑷=⑵⑶

268 503 771(∑Nipi)

乙 医 院

原生存率

Pi ⑸ 71.67 50.60 67.10

预期生存人数

Nipi ⑹=⑵⑸

247 401 648(∑Nipi)

甲医院乳腺癌手术后的5年生存率的标化生存率: 'NiPi771p100%100%67.75% N1138

乙医院乳腺癌手术后的五年生存率标化生存率: 'NiPi648p100%100%56.94% N1138

因为甲、乙两医院有无腋下淋巴结转移的病情构成不同,故标化后,甲医院乳腺癌手术后的5年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。

6.某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116(mg/L),血铅均数为1.81(mg/L)。服用果胶20天后再测,尿铅均数降为0.087(mg/L),血铅均数降为0.73(mg/L),说明果胶驱铅的效果较好。请评述以上研究。

人体有自行排铅的功能,应设对照组,并进行假设检验后才能下结论。


相关内容

  • 认真阅读:陕西省卫生副高职称晋升政策的通知
  • 认真阅读:陕西省卫生副高职称晋升政策的通知 我是安康的一个三甲医院医生,准备了几年时间,跌跌撞撞总算成功晋升副高,很多同行们晋升之前由于没有充分做好准备,耽误很多时间,现在发现网上搜的很多东西不真实,并不可信,我看了一下,关于陕西高级卫生职称评审的很多政策都是错的,有的是过期的,在此,我将最新的政策 ...

  • 病案信息技术副高考试考试大纲和考试经验
  • 病案信息技术副高考试考试大纲和考试经验 一.专业知识 (一) 本专业知识 1.基本掌握病案信息学专业的基本理论与基础知识,包括病案管理.病案质控.国际疾病分类.手术分类. 2.掌握病案的管理方法,能独立地设计病案科的基本工作流程并熟悉每一个操作环节. (二) 相关专业知识 基本掌握或了解与本专业密切 ...

  • 国际经济与贸易考研有关事项
  • 国际经济与贸易考研有关事项 有有关关国国贸贸专专业业各各个个高高校校研研究究生生专专业业排排名名 排名 校名 等级 一级学科 1对外经济贸易大学 A++ 020206国际贸易学 2浙江大学 A++ 020206国际贸易学 3 湖南大学 A+ 020206国际贸易学 4 上海财经大学 A+ 02020 ...

  • 研究生的种类
  • 本帖子是为了那些想考研而不知道怎么着手复习的人准备的,我们会持续更新此帖,希望对你会有所帮助. 研究生的种类 尽管"研究生"这个词绝对是耳熟能详,但到底有哪些种类,十分清楚的人却大概不多. 研究生教育属于国民教育序列中的高等教育,又分为两个层次:硕士研究生和博士研究生.目前我国硕 ...

  • 天津大学工业工程考研学长汇总经验
  • 为方便大家考研收集的资料,把去年自己收集的资料汇总一下,给下一级的学弟学妹们做个参考. 管院简介: 天大管院今年起和经济学院合并了,组成经济与管理学部,主任是张维,在天财做过副校长,现在不知还兼任部,以前管院的院长齐二石不做了.这样管院就分为管理科学与工程,工商管理,行政管理,加上并过来的经济类四部 ...

  • 职称英语做题技巧
  • 职称英语考试技巧 许多职称英语考生问我这个问题,掌握一定的职称英语考试技巧有助于通过2010年职称英语考试.本文就给大家介绍一下词汇选项题的职称英语考试技巧. 词汇选项题它也有比较明显的送分的趋势,像15个词汇选项题,通常有4到9个的词汇选项题直接来自于教材的词汇选项的部分.当然也可能会做一些变动, ...

  • 天津大学管理学院考研与研究生就业情况
  • 转帖,天大管理各专业历年分数线,就业情况等介绍 本人07年考的管院,初试395分,专业第三,在本版上发帖子"管理学院区"后得到了大家支持,回帖达40页,为了方便大家的阅读,也减少我回帖的工作量,特把一些基本问题和共性问 题予以汇总 具体内容如下: 1.天津大学管理学院简介 2.0 ...

  • 2011南宁事业单位考试复习内容
  • 2011南宁事业单位考试复习内容 <公共科目-公共基础知识>目录 第一篇事业单位 第二章事业单位管理体制 第三章事业单位管理制度 第二篇马克思主义基础知识.马克思主义哲学部分 第一章辩证唯物主义 第二章 唯物主义辩证法 第三章认识论 第四章 历史唯物主义 第五章 毛泽东思想的形成与发展. ...

  • 统计业务知识习题
  • 统计业务知识习题 一.单选题 1.统计工作过程大致可以分为以下几个阶段(C). A.统计设计.统计调查.统计整理.统计汇总 B.统计调查.统计整理.统计分析 C.统计设计.统计调查.统计整理.统计分析 D.统计设计.统计调查.统计整理 2.统计设计按工作阶段可分为(A). A.整体设计和专项设计 B ...