临床研究的样本量估算及其影响因素

临床研究是一种有计划的科研活动,样本量估算是这项活动中具有挑战性的工作之一。在临床研究工作中,我经常遇到研究者一见面就问我“你看我的研究样本量多少合适?”,往往我会被直接问懵。因为临床研究千奇百怪,什么研究方向都有,大家不可能都是一个相同的样本量!还有一些人非常坚持,不论什么研究,必须算出样本量,不然他就觉得研究设计不对。针对上述两个问题,作一讨论。

1、所有的临床研究都需要计算样本量吗?

按照临床研究的三阶段模式,临床研究可以分为探索性临床研究、培育性临床研究和验证性临床研究,也有地方将临床研究仅分为探索性和确证性两种。

探索性临床研究可以是研究者的一个设想,也可以是前期临床工作中的偶然发现,研究的主要任务是初步验证而不是“盖棺定论”,探索这一方向是否值得进一步研究即可。探索性研究可以不使用统计学公式去估算样本量,但需要对所选用的样本量进行充分的说明,体现其合理性。如针对某全新的手术方式开展的早期探索,在没有足够的疗效和安全性的数据之下,可能3-5例研究对象就足够了。

培育性研究是在探索性研究的基础上进一步深入和细化,寻找待研究问题的规律所在。培育性研究可以不采用统计学公式估算样本量,但应该在研究方案中明确说明所选取样本量大小的理由,当然培育性也可以估算样本量。

验证性研究又是在培育性研究的基础之上采用合理的方法、严格的控制去验证规律的可靠性。验证性研究往往需要估算样本量,且有学者认为验证性研究样本量估算的把握度(Power)至少90%才合适。

看了上面的一些内容,您还觉得所有研究都需要计算样本量吗?

2、样本量估算的参数都有哪些?

样本量估算也跟算命一样,它们都是对未来事件的预测。我们知道算命是需要一些信息的,比如生辰八字。那么样本量估算也需要信息,所有我们在找统计人员去估算的样本量的时候一定要给他提供一些您的研究的相关信息。下面逐一介绍:

(1)研究设计类型

比如本研究是横断面调查,就想去了解一下我国人群的某病患病率。又如本研究是一个自身前后对照研究,想看看用药前后疗效如何。或者本研究是一个两组的RCT,想比较不同组之间的差别。还有本研究是一个生存分析,相比较不同组的生存差异。又或者本研究是一个三组的比较……,等等。不同的研究设计类型,其样本量估算方法是不同的。

(2)研究主要终点指标及其预期数值

在研究设计之初,我们应该是有想法的,知道本研究需要探索哪些指标。哪些又是重要探索的主要终点指标,哪些是次要终点指标。在样本量计算时我们明确主要终点指标及其预期的数值。比如这是一个疗效的RCT研究,主要终点指标就是治疗有效率,预期估计A组的有效率是56%,B组的有效率是78%。又如这是一个自身前后对照研究,预期估计干预后某主要终点指标下降情况为2.56±0.45。那么这个预期估计又怎么来呢,我们说最好是预实验的结果,次之是文献报告的结果,最次的是专家咨询的结果。

(3)犯错误的概率

这包括Ⅰ类错误和Ⅱ类错误,Ⅰ类错误的概率α一般取0.05;Ⅱ类错误的概率大小β,等于1减把握度(power),一般取0.1或0.2。Ⅰ类错误α是指你没有接受正确的H0的概率,也就是你拒绝了正确的H0的概率,这个概率当然是越小越好。但是我们往往取这个值为0.05,也就是小概率事件的发生概率。Ⅱ类错误β是指你没有拒绝错误的H0的概率,也就是你接受了错误的H0的概率,这个概率当然也是越小越好。一般我们取0.1或0.2,也就是说当H0真的不成立,如果让你重复100次研究,你的研究结果可以有10-20次接受H0。反过来说,就是你的每一次研究都有80%-90%的把握拒绝假的H0。

(4)界值的大小

我们知道假设检验有以0为参照差异性检验和以界值δ为参照的等效、优效和非劣效检验。界值是指研究者设定的为了某一目的而存在的数值大小,比如研究者假定A药非劣效于B药,取非劣效界值为10 mmol/L,也就是如果研究结果显示A药的疗效比B药差10 mmol/L以内,都认为A药非劣效与B药。优效性研究也是一样。

(5)其他参数

其他参数包括单侧或双侧检验、抽样方法的不同以及失访率等。抽样方法除了完全随机抽样以外,还有整群抽样、多阶段抽样等,这些都需要对样本量进行适当的调整。除此之外,还需要考虑研究的失访情况。

临床研究是一种有计划的科研活动,样本量估算是这项活动中具有挑战性的工作之一。在临床研究工作中,我经常遇到研究者一见面就问我“你看我的研究样本量多少合适?”,往往我会被直接问懵。因为临床研究千奇百怪,什么研究方向都有,大家不可能都是一个相同的样本量!还有一些人非常坚持,不论什么研究,必须算出样本量,不然他就觉得研究设计不对。针对上述两个问题,作一讨论。

1、所有的临床研究都需要计算样本量吗?

按照临床研究的三阶段模式,临床研究可以分为探索性临床研究、培育性临床研究和验证性临床研究,也有地方将临床研究仅分为探索性和确证性两种。

探索性临床研究可以是研究者的一个设想,也可以是前期临床工作中的偶然发现,研究的主要任务是初步验证而不是“盖棺定论”,探索这一方向是否值得进一步研究即可。探索性研究可以不使用统计学公式去估算样本量,但需要对所选用的样本量进行充分的说明,体现其合理性。如针对某全新的手术方式开展的早期探索,在没有足够的疗效和安全性的数据之下,可能3-5例研究对象就足够了。

培育性研究是在探索性研究的基础上进一步深入和细化,寻找待研究问题的规律所在。培育性研究可以不采用统计学公式估算样本量,但应该在研究方案中明确说明所选取样本量大小的理由,当然培育性也可以估算样本量。

验证性研究又是在培育性研究的基础之上采用合理的方法、严格的控制去验证规律的可靠性。验证性研究往往需要估算样本量,且有学者认为验证性研究样本量估算的把握度(Power)至少90%才合适。

看了上面的一些内容,您还觉得所有研究都需要计算样本量吗?

2、样本量估算的参数都有哪些?

样本量估算也跟算命一样,它们都是对未来事件的预测。我们知道算命是需要一些信息的,比如生辰八字。那么样本量估算也需要信息,所有我们在找统计人员去估算的样本量的时候一定要给他提供一些您的研究的相关信息。下面逐一介绍:

(1)研究设计类型

比如本研究是横断面调查,就想去了解一下我国人群的某病患病率。又如本研究是一个自身前后对照研究,想看看用药前后疗效如何。或者本研究是一个两组的RCT,想比较不同组之间的差别。还有本研究是一个生存分析,相比较不同组的生存差异。又或者本研究是一个三组的比较……,等等。不同的研究设计类型,其样本量估算方法是不同的。

(2)研究主要终点指标及其预期数值

在研究设计之初,我们应该是有想法的,知道本研究需要探索哪些指标。哪些又是重要探索的主要终点指标,哪些是次要终点指标。在样本量计算时我们明确主要终点指标及其预期的数值。比如这是一个疗效的RCT研究,主要终点指标就是治疗有效率,预期估计A组的有效率是56%,B组的有效率是78%。又如这是一个自身前后对照研究,预期估计干预后某主要终点指标下降情况为2.56±0.45。那么这个预期估计又怎么来呢,我们说最好是预实验的结果,次之是文献报告的结果,最次的是专家咨询的结果。

(3)犯错误的概率

这包括Ⅰ类错误和Ⅱ类错误,Ⅰ类错误的概率α一般取0.05;Ⅱ类错误的概率大小β,等于1减把握度(power),一般取0.1或0.2。Ⅰ类错误α是指你没有接受正确的H0的概率,也就是你拒绝了正确的H0的概率,这个概率当然是越小越好。但是我们往往取这个值为0.05,也就是小概率事件的发生概率。Ⅱ类错误β是指你没有拒绝错误的H0的概率,也就是你接受了错误的H0的概率,这个概率当然也是越小越好。一般我们取0.1或0.2,也就是说当H0真的不成立,如果让你重复100次研究,你的研究结果可以有10-20次接受H0。反过来说,就是你的每一次研究都有80%-90%的把握拒绝假的H0。

(4)界值的大小

我们知道假设检验有以0为参照差异性检验和以界值δ为参照的等效、优效和非劣效检验。界值是指研究者设定的为了某一目的而存在的数值大小,比如研究者假定A药非劣效于B药,取非劣效界值为10 mmol/L,也就是如果研究结果显示A药的疗效比B药差10 mmol/L以内,都认为A药非劣效与B药。优效性研究也是一样。

(5)其他参数

其他参数包括单侧或双侧检验、抽样方法的不同以及失访率等。抽样方法除了完全随机抽样以外,还有整群抽样、多阶段抽样等,这些都需要对样本量进行适当的调整。除此之外,还需要考虑研究的失访情况。


相关内容

  • 临床试验设计中样本含量的理解_李河
  • 2012年12月第12卷第6期 循证医学 The Journal of Evidence-Based Medicine Dec.2012Vol.12No.6 循证医学中的医学统计学问题·· 临床试验设计中样本含量的理解 李 河1, 李 卫2, 杨学宁1, 吴一龙 1 (1.广东省人民医院.广东省医学 ...

  • 卫生统计学教学大纲
  • 卫生统计学教学大纲 (供预防医学专业五年制本科生使用) 前言 卫生统计学是研究居民健康状况以及卫生服务领域中数据的收集.整理和分析的一门科学.本课程的教学目的是为学生在校学习专业课程,毕业后从事公共卫生领域的研究和实际工作,打下必要的卫生统计学基础.在学习本课程时,应注意掌握卫生统计学的基本理论.基 ...

  • 15第十二章新药临床前药物代谢动力学研究
  • 第十二章 新药临床前药物代谢动力学研究 第一节 新药临床前药物代谢动力学研究的目的和意义 创新药物的开发是一项高风险.高投入和高回报的产业.一旦一个创新药物开发成功并上市就可以为开发者带来巨额的利润.但目前创新药物开发的成功率的很低,命中率约为五万分之一,在发达国家开发成功一种新药需要耗资5-10亿 ...

  • C28-A2生物参考区间
  • 临床实验室如何确定和建立生物参考区间 (核准指南――第二版) 1 内容简介 此指南是专为指导临床诊断实验室.诊断仪器试剂制造商和临床检验工作者在定量实验检测中确定参考值和参考区间而制定的.它包括在临床医学实验室中建立可靠的参考区间所用的方法步骤和推荐程序.而该推荐程序的主要内容是如何用最简便和最务实 ...

  • 样本量计算
  • 1.估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例. 1.2 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大. 1. ...

  • 科研计划书
  • 科研计划书 一.研究题目 二.研究的目的意义 三.研究项目当前的研究现状(国内现状和国外现状) 四.研究的内容框架(提出要研究内容的框架体系) 五.研究方法 六.参考文献 医学科研计划书的撰写 科研课题确定下来以后,接下来的工作就是要撰写一份科研计划书.科研计划书既是研 究课题的分阶段.分步骤地细化 ...

  • 中医科研方法设计的五原则
  • 中医药科研设计-五原则 [目的要求] 掌握科研设计五原则 科研设计的五原则 一.对照的原则 概念:在调查研究或实验研究的过程中,确立可供相互比较的组别. 目的:是为了抵消非处理因素的干扰和影响,从而确认处理因素的 真实效应. 常用方法: ● 同期随机对照: (平行对照) 实(试)验组和对照组研究同步 ...

  • 盐摄入量的测量方法应用与评价
  • DOI:10.16439/j.cnki.1673-7245.2014.09.012 ,中华高血压杂志 2014年9月第22卷第9期 ChinJHertensSetember2014,Vol.22No.9 ypp·827· ·指南与实践· 盐摄入量的测量方法.应用与评价 侯萌,牟建军 西安交通大学医学 ...

  • 样本量估算
  • 1. 单因素二水平设计定量资料的非劣效性检验时样本量的估算 1.1计算公式: 非劣效性检验应当采用单侧的检验水准α,假定允许的第二类错误概率不超过β,则非劣效性检验每组需要的样本含量为: n =2(u 1-α+u 1-β) 2S 2/(δL -θ) 2(1-1)[1] 2(1-2)[2] n 1=n ...