・336・
三种不同方法估算等效性检验的样本量与检验效能3
第四军医大学预防医学系卫生统计学教研室(710032) 于莉莉 夏结来 蒋红卫
Δ
关于等效性检验的样本量与检验效能估计,SAS
中提供了一种方法的估算程序, 即Phillips 法, 但是只是针对于单样本、两样本与配对设计而言。然而, 在以等效性检验为目的的临床试验中, 双处理、设计应用最为广泛, 并在1992FDA 物间的差(, 兼有既平行、Phillips 方法进一步推广到2×2样本量与检验效能的两种方法作了比较, 以期为研究者提供参考。
方法简介
11一般方法
0,
(2-)
N -2(1(t 1-α(N -2) )
, ) Owen ’s Q 函数, 它是由Owen
在, 该函数的数学表述如下〔5〕:
Q v (t , δ; a , b ) =
(Гx 2
) 2
2
a
b
Φ(-δ)
v
N 表示每组样本量, σ表示两组合并的标准差,
) 处的分t 1-α, (N -1) 自由度为N -1的t 分布在(1-αθ位数; θ上限, Φ(x ) 、
分别为标准正态分布的累积分布函数与密度函数, w 1, w 2为两组的权重, 且w 1+w 2=1。
SAS 中利用Phillips 法计算单样本设计、配对设
v -1
通常情况下, 习惯用下列公式来估算等效性检验
1〕
的样本量〔:
当θ=0时
) ) ]2(1) n =2[(u 1-α+u 1-β/2) (σ/(Δ-θ
当θ≠0时
) ) ]2(2) n =2[(u 1-α+u 1-β) (σ/(Δ-θ
Δ为研究者预先设定的等效界值, θ为两药物效应值之差, σ为方差分析模型中误差均方的平方根, n T 、n R 分别为实验组与对照组的样本量且n T =n R ; 如果两组样本例数不等的话, 可以结合下面的公式稍
2
(+u ) 〔3〕
(Q 1-1+Q 2-2) 。Q 1、作调整:N =Q 2
(Δ-θ)
为样本分配比, 当两组样本例数不等时, 应按照样本分配的比例将例数分入两组, 因此, Q 1+Q 2=1。
21Phillips 方法
Phillips 在1990年提出一个计算平衡设计的两样本等效性检验的确切检验效能的公式, 它同样适用于
4〕
单样本设计、配对设计〔与两阶段交叉设计。
μθPower =Q
N -2(-t 1-α(N -2) ) ,
计、两样本设计三种设计形式的样本量与检验效能时,
μμ需要设定以下几个参数:null dif f erence =
μR
CV =μ α=0105, 等效限为(-0120μR ,
R
0120μR ) 。需要注意的是, SAS 中并没有提供两阶段交叉设计的样本量与检验效能的计算程序, 所以对于2×2交叉设计, 尝试按照配对设计的计算公式来估算其样本量, 只是在计算参数CV 的时候将配对设计中差值的标准差σ设为交叉设计F 检验误差均方的平方根即S e 。
31模拟方法
(1) 建立线性模型为:
Y (ijk ) =μ+τ(i ) +p (j ) +s (k ) +e
其中, Y (ijk ) 表示总效应, μ表示总体均数, τ(i ) 为处理效应, p (j ) 、s (k ) 分别为时期(阶段) 作用与个体之间的
2变异, e 为误差项且e ~N (0, σe ) 。
(2) 模拟设计
依据上述线性模型, 在不同的参数组合下, 随机抽样1000次, 在检验水准为0110(α为0105) 的情况下,
) 100%的可信区间来判断每个依据μT -μR 的(1-2α
样本等效与否, 然后再依据1000个样本的检验结果计算其检验效能; 当结果达到预先所要求达到的检验效能时, 此时样本量即为所求样本量。
σN
-
2
(w 1w 2)
-
2
;
0,
() 2(θθ)
--2σN 2(w 1w 2) 2(t 1-α(N -2) )
-Q N -2
(t 1-α(N -2) ) ,
μ-
σN
2
(w 1w 2)
-
2
;
结果与分析
3:国家自然科学基金资助项目(30271157) Δ:通讯作者:夏结来E 2mail :nosa@21cn. com
11表1为Phillips 法、传统方法与抽样模拟结果
・337・
的比较。从表中可以看到:利用Phillips 方法计算的样本量更接近于模拟的结果, 而传统方法则略低。 21表2是预定检验效能为0180, 分别用Phillips 方法与传统方法估算的样本量以及利用此样本量反模拟其所对应的检验效能的比较。由表中数字可以看出:依据Phillips 法估算的样本量随机抽样5000次, 模拟其检验效能, 基本都在预定的检验效能0180左
(2) 的计算结果相右, 与传统方法分别利用公式(1) 、
近。由此可见, 这种方法也可避免传统方法关于β取单侧还是双侧分歧。
表1 检验效能为018时不同方法估计两阶段
交叉设计的样本量比较
θ
CV
F (t )
31表3为分别用一般公式计算、抽样模拟与
Phillips 法估算θ=0、样本量分别为10、20、30时等效性检验的样本量与检验效能。值得注意的是, 利用一
2
) (2σ般公式(1) 推倒出来的公式1-β=2Φ[(Δ-θ/
n )
-2
-z 1-α]-1计算检验效能的时候, 当n 很小或
CV 很大的时候, 均会得到小于0的结果, 这显然与实
际不符, 而Phillips , 计算结果与模。
表2(Δ=0120μR )
θ
CV
0105
Phillips 法
n
0105
S
F (t )
0S
P
F (t )
0115
S
P
一般方法
n
一般方法
n
Phillips 法
n
power 01785
[***********][***********][***********][**************]0power [***********][***********][***********][***********]794power [***********][***********][***********][***********]792power [***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][1**********]2 3:F (t ) :传统公式计算, S :模拟结果, P :Phillips 法。
3:设计类型为2×2交叉设计
θ=0, Δ=0120μR ) 表3 不同方法估算一定样本量的等效性检验的检验效能(
n
CV
F (t )
10
S
P
F (t )
20
S
P
F (t )
30
S
P
0120
[***********][***********][***********]48-----------[***********][***********][***********][***********][**************]
[***********][***********][***********][***********][***********]02701014
小 结
对于等效性检验样本量与检验效能的估算, 除文
中所介绍的方法之外, 还有其他方法可用, 如两阶段抽样法、Bayesian 法。利用传统的公式计算, 简单易于接受, 但是β存在取单侧还是双侧的分歧; 模拟方法的结
果虽然可靠, 但是费时费力, 一般情况下不宜采用; Phillips 法估计的样本量更接近于模拟结果且能够弥补传统方法与模拟方法的不足, 只是理论理解起来比较困难。研究者应根据自己的需要, 结合各种方法的应用条件, 扬长避短, 方能得到比较理想的结果。
・338・
参 考 文 献
11Chow SC ,Liu J P. Design and Analysis of Bioavailability and Bioequiva 2
lence Studies , Second Edition , Revised and Expanded , Maecel Dekker , INC. New Y ork ,2000:1230,1252132.
21Department of Health and Human Services Food and Drug Administration Center for Drug Evaluation and Research (CDER ) . Guidance for Indus 2
try 2Statistical Approaches to Establishing Bioequivalence US ,2001.
31傅华忠. 关于医学统计假设检验的样本含量问题. 遵义医学院学报, 2000,23(1) :88290.
41Phillips KF. Power of the two one 2sided tests procedure in bioquivalence. J Pharm Biopharm ,1990,18(2) :1372144.
51Owen DB. A Special Case of a Bivariate Non 2Central t 2Distribution. Biometrika ,1965,52:4372446.
青岛市第八人民医院(266100 韩冬梅 邹晓明
作时临时口服硝酸甘油外, 均停服一切中西药物。
三、观察内容:两组病人分别在疗程前后各测一次血液流变学、心电图、血脂及指标变化。
结果与分析
一、临床疗效见表1。治疗组显效率72%, 总有效率92%; 对照显效率为44%, 总有效率为66%。两组平均Ridit 值差别的检验结果如下。
表1 两组临床疗效比较
组别治疗组
对照组
n
本文用Ridit 患者, 结果如下。
资料与方法
一、病例选择:按WHO 标准确诊的冠心病心绞痛患者100例, 其中31例经外院冠状动脉造影证实, 其余69例心电图有明确的ST -缺血改变。随机分组100例患者分为治疗组和对照组。治疗组50例, 其中男性30例, 女性20例; 年龄63~78岁, 平均年龄75102岁, 病程2年至11年, 平均5132年, 对照组50例, 其中男性32例, 女性18例; 年龄70~76岁, 平均74132岁; 病程2年至9年, 平均4124年; 两组患者年龄、性别、病程经显著性检验均无统计学意义, 具有可比性。
二、治疗方法:治疗组给通心络胶囊每次4粒, 每日3次; 对照组给予复方丹参片, 每次4粒, 每日3次。两组病人疗程均为
3个月。两组均经一个疗程的治疗, 期间除部分患者心绞痛发
等级
显效
36(72100) 22(44100)
有效
10(20100) 11(22100)
无效
4(8100) 17(34100)
总有效率
()
9266
5050
11将两组的频数合并为标准频数分布, 计算各等级的Rid 2
it 值。
(4) /[1**********]10
(4) 累计并移
(5) +(6) =
[1**********]0
Ridit =(7) /N
[**************]
表2 各等级Ridit 值计算
治疗组
4103650
对照组
17112250
合计
212158150
下一行(6)
02142
无效
有效显效合计
21以各等级Ridit 值作为标准, 分别计算治疗组及对照组平均Ridit 值:
R 1治疗组=(4×01105+10×01315+36×0171) /50=
证明两组治疗效果有统计学意义。
二、心电图疗效见表3。通心络胶囊能够明显改善缺血性心电图, 与对照组相比有统计学意义(P 0105) 。
表3 两组心电图指标改善比较
组别治疗组
对照组
n 5050
015826
R 2对照组=(17×01105+11×01315+22×0171) /50=
014174
31用下列公式作差别的统计意义检验:u =
S R 1+S R 2
2
2
2
显效
1711
有效
1813
无效总有效率(%)
1526
7048
=
S R (n 1+n 2) /n 1n 2
2
=用近似法
讨 论
冠心病是目前临床上最常见的心血管疾病之一, 本文通过
50例冠心病心绞痛的防治发现, 通心络胶囊治疗老年人冠心病
1/12估计S R
则u =
=
/12n 1+1/12n 2
=
1/12×(n 1+n 2) /n 1×n 2
=2186
/12×(50+50) /50×50按u 服从正态分布u ≥2158 P ≤0101, 差别有统计意义,
心绞痛临床疗效及血脂、血液流变学及心电图等改变明显优于
对照组。所以, 用于治疗冠心病心绞痛的通心络胶囊是一种非常有效的安全药物, 可以作为常规药之一。
・336・
三种不同方法估算等效性检验的样本量与检验效能3
第四军医大学预防医学系卫生统计学教研室(710032) 于莉莉 夏结来 蒋红卫
Δ
关于等效性检验的样本量与检验效能估计,SAS
中提供了一种方法的估算程序, 即Phillips 法, 但是只是针对于单样本、两样本与配对设计而言。然而, 在以等效性检验为目的的临床试验中, 双处理、设计应用最为广泛, 并在1992FDA 物间的差(, 兼有既平行、Phillips 方法进一步推广到2×2样本量与检验效能的两种方法作了比较, 以期为研究者提供参考。
方法简介
11一般方法
0,
(2-)
N -2(1(t 1-α(N -2) )
, ) Owen ’s Q 函数, 它是由Owen
在, 该函数的数学表述如下〔5〕:
Q v (t , δ; a , b ) =
(Гx 2
) 2
2
a
b
Φ(-δ)
v
N 表示每组样本量, σ表示两组合并的标准差,
) 处的分t 1-α, (N -1) 自由度为N -1的t 分布在(1-αθ位数; θ上限, Φ(x ) 、
分别为标准正态分布的累积分布函数与密度函数, w 1, w 2为两组的权重, 且w 1+w 2=1。
SAS 中利用Phillips 法计算单样本设计、配对设
v -1
通常情况下, 习惯用下列公式来估算等效性检验
1〕
的样本量〔:
当θ=0时
) ) ]2(1) n =2[(u 1-α+u 1-β/2) (σ/(Δ-θ
当θ≠0时
) ) ]2(2) n =2[(u 1-α+u 1-β) (σ/(Δ-θ
Δ为研究者预先设定的等效界值, θ为两药物效应值之差, σ为方差分析模型中误差均方的平方根, n T 、n R 分别为实验组与对照组的样本量且n T =n R ; 如果两组样本例数不等的话, 可以结合下面的公式稍
2
(+u ) 〔3〕
(Q 1-1+Q 2-2) 。Q 1、作调整:N =Q 2
(Δ-θ)
为样本分配比, 当两组样本例数不等时, 应按照样本分配的比例将例数分入两组, 因此, Q 1+Q 2=1。
21Phillips 方法
Phillips 在1990年提出一个计算平衡设计的两样本等效性检验的确切检验效能的公式, 它同样适用于
4〕
单样本设计、配对设计〔与两阶段交叉设计。
μθPower =Q
N -2(-t 1-α(N -2) ) ,
计、两样本设计三种设计形式的样本量与检验效能时,
μμ需要设定以下几个参数:null dif f erence =
μR
CV =μ α=0105, 等效限为(-0120μR ,
R
0120μR ) 。需要注意的是, SAS 中并没有提供两阶段交叉设计的样本量与检验效能的计算程序, 所以对于2×2交叉设计, 尝试按照配对设计的计算公式来估算其样本量, 只是在计算参数CV 的时候将配对设计中差值的标准差σ设为交叉设计F 检验误差均方的平方根即S e 。
31模拟方法
(1) 建立线性模型为:
Y (ijk ) =μ+τ(i ) +p (j ) +s (k ) +e
其中, Y (ijk ) 表示总效应, μ表示总体均数, τ(i ) 为处理效应, p (j ) 、s (k ) 分别为时期(阶段) 作用与个体之间的
2变异, e 为误差项且e ~N (0, σe ) 。
(2) 模拟设计
依据上述线性模型, 在不同的参数组合下, 随机抽样1000次, 在检验水准为0110(α为0105) 的情况下,
) 100%的可信区间来判断每个依据μT -μR 的(1-2α
样本等效与否, 然后再依据1000个样本的检验结果计算其检验效能; 当结果达到预先所要求达到的检验效能时, 此时样本量即为所求样本量。
σN
-
2
(w 1w 2)
-
2
;
0,
() 2(θθ)
--2σN 2(w 1w 2) 2(t 1-α(N -2) )
-Q N -2
(t 1-α(N -2) ) ,
μ-
σN
2
(w 1w 2)
-
2
;
结果与分析
3:国家自然科学基金资助项目(30271157) Δ:通讯作者:夏结来E 2mail :nosa@21cn. com
11表1为Phillips 法、传统方法与抽样模拟结果
・337・
的比较。从表中可以看到:利用Phillips 方法计算的样本量更接近于模拟的结果, 而传统方法则略低。 21表2是预定检验效能为0180, 分别用Phillips 方法与传统方法估算的样本量以及利用此样本量反模拟其所对应的检验效能的比较。由表中数字可以看出:依据Phillips 法估算的样本量随机抽样5000次, 模拟其检验效能, 基本都在预定的检验效能0180左
(2) 的计算结果相右, 与传统方法分别利用公式(1) 、
近。由此可见, 这种方法也可避免传统方法关于β取单侧还是双侧分歧。
表1 检验效能为018时不同方法估计两阶段
交叉设计的样本量比较
θ
CV
F (t )
31表3为分别用一般公式计算、抽样模拟与
Phillips 法估算θ=0、样本量分别为10、20、30时等效性检验的样本量与检验效能。值得注意的是, 利用一
2
) (2σ般公式(1) 推倒出来的公式1-β=2Φ[(Δ-θ/
n )
-2
-z 1-α]-1计算检验效能的时候, 当n 很小或
CV 很大的时候, 均会得到小于0的结果, 这显然与实
际不符, 而Phillips , 计算结果与模。
表2(Δ=0120μR )
θ
CV
0105
Phillips 法
n
0105
S
F (t )
0S
P
F (t )
0115
S
P
一般方法
n
一般方法
n
Phillips 法
n
power 01785
[***********][***********][***********][**************]0power [***********][***********][***********][***********]794power [***********][***********][***********][***********]792power [***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][1**********]2 3:F (t ) :传统公式计算, S :模拟结果, P :Phillips 法。
3:设计类型为2×2交叉设计
θ=0, Δ=0120μR ) 表3 不同方法估算一定样本量的等效性检验的检验效能(
n
CV
F (t )
10
S
P
F (t )
20
S
P
F (t )
30
S
P
0120
[***********][***********][***********]48-----------[***********][***********][***********][***********][**************]
[***********][***********][***********][***********][***********]02701014
小 结
对于等效性检验样本量与检验效能的估算, 除文
中所介绍的方法之外, 还有其他方法可用, 如两阶段抽样法、Bayesian 法。利用传统的公式计算, 简单易于接受, 但是β存在取单侧还是双侧的分歧; 模拟方法的结
果虽然可靠, 但是费时费力, 一般情况下不宜采用; Phillips 法估计的样本量更接近于模拟结果且能够弥补传统方法与模拟方法的不足, 只是理论理解起来比较困难。研究者应根据自己的需要, 结合各种方法的应用条件, 扬长避短, 方能得到比较理想的结果。
・338・
参 考 文 献
11Chow SC ,Liu J P. Design and Analysis of Bioavailability and Bioequiva 2
lence Studies , Second Edition , Revised and Expanded , Maecel Dekker , INC. New Y ork ,2000:1230,1252132.
21Department of Health and Human Services Food and Drug Administration Center for Drug Evaluation and Research (CDER ) . Guidance for Indus 2
try 2Statistical Approaches to Establishing Bioequivalence US ,2001.
31傅华忠. 关于医学统计假设检验的样本含量问题. 遵义医学院学报, 2000,23(1) :88290.
41Phillips KF. Power of the two one 2sided tests procedure in bioquivalence. J Pharm Biopharm ,1990,18(2) :1372144.
51Owen DB. A Special Case of a Bivariate Non 2Central t 2Distribution. Biometrika ,1965,52:4372446.
青岛市第八人民医院(266100 韩冬梅 邹晓明
作时临时口服硝酸甘油外, 均停服一切中西药物。
三、观察内容:两组病人分别在疗程前后各测一次血液流变学、心电图、血脂及指标变化。
结果与分析
一、临床疗效见表1。治疗组显效率72%, 总有效率92%; 对照显效率为44%, 总有效率为66%。两组平均Ridit 值差别的检验结果如下。
表1 两组临床疗效比较
组别治疗组
对照组
n
本文用Ridit 患者, 结果如下。
资料与方法
一、病例选择:按WHO 标准确诊的冠心病心绞痛患者100例, 其中31例经外院冠状动脉造影证实, 其余69例心电图有明确的ST -缺血改变。随机分组100例患者分为治疗组和对照组。治疗组50例, 其中男性30例, 女性20例; 年龄63~78岁, 平均年龄75102岁, 病程2年至11年, 平均5132年, 对照组50例, 其中男性32例, 女性18例; 年龄70~76岁, 平均74132岁; 病程2年至9年, 平均4124年; 两组患者年龄、性别、病程经显著性检验均无统计学意义, 具有可比性。
二、治疗方法:治疗组给通心络胶囊每次4粒, 每日3次; 对照组给予复方丹参片, 每次4粒, 每日3次。两组病人疗程均为
3个月。两组均经一个疗程的治疗, 期间除部分患者心绞痛发
等级
显效
36(72100) 22(44100)
有效
10(20100) 11(22100)
无效
4(8100) 17(34100)
总有效率
()
9266
5050
11将两组的频数合并为标准频数分布, 计算各等级的Rid 2
it 值。
(4) /[1**********]10
(4) 累计并移
(5) +(6) =
[1**********]0
Ridit =(7) /N
[**************]
表2 各等级Ridit 值计算
治疗组
4103650
对照组
17112250
合计
212158150
下一行(6)
02142
无效
有效显效合计
21以各等级Ridit 值作为标准, 分别计算治疗组及对照组平均Ridit 值:
R 1治疗组=(4×01105+10×01315+36×0171) /50=
证明两组治疗效果有统计学意义。
二、心电图疗效见表3。通心络胶囊能够明显改善缺血性心电图, 与对照组相比有统计学意义(P 0105) 。
表3 两组心电图指标改善比较
组别治疗组
对照组
n 5050
015826
R 2对照组=(17×01105+11×01315+22×0171) /50=
014174
31用下列公式作差别的统计意义检验:u =
S R 1+S R 2
2
2
2
显效
1711
有效
1813
无效总有效率(%)
1526
7048
=
S R (n 1+n 2) /n 1n 2
2
=用近似法
讨 论
冠心病是目前临床上最常见的心血管疾病之一, 本文通过
50例冠心病心绞痛的防治发现, 通心络胶囊治疗老年人冠心病
1/12估计S R
则u =
=
/12n 1+1/12n 2
=
1/12×(n 1+n 2) /n 1×n 2
=2186
/12×(50+50) /50×50按u 服从正态分布u ≥2158 P ≤0101, 差别有统计意义,
心绞痛临床疗效及血脂、血液流变学及心电图等改变明显优于
对照组。所以, 用于治疗冠心病心绞痛的通心络胶囊是一种非常有效的安全药物, 可以作为常规药之一。