Professional Documents
Culture Documents
对药物临床试验中置信区间法预设检验界值的考虑
对药物临床试验中置信区间法预设检验界值的考虑
对药物临床试验中置信区间法预设检验界值的考虑
对药物临床试验中置信区间法预设检验界值的考虑
Consideration for the pre - specified margin of the confidence interval approach in
drug clinical trials
优效、等效和非劣效试验是药物临床试验中广泛应用的试验方
法。其置信区间( confidence interval,CI) 方法的预设检验界值是事关
这些试验成功与否的关键因素之一。 研究显示,很多试验的非劣效
[1 - 2]
界值设定 方 法 不 合 理 ,或 未 能 提 供 确 定 非 劣 效 界 值 的 合 理 理
[3 - 4]
由 ,在一些 抗 肿 瘤 药 物 临 床 试 验 中 倾 向 使 用 较 大 的 非 劣 效 界
[5]
值 。检验界值设定不当将会推断出错误的试验结论 ,并导致医师
[6]
在临床实践中对试验结果的解读产生困惑 ,需要引起申办方和监
收稿日期: 2019 - 08 - 26 管机构的关注。为了促使药品临床试验的检验界值设定更加科学合
定稿日期: 2019 - 09 - 16
理,本文阐述了对 3 种试验方法的检验界值概念、度量类型、设定条
基金项目: 国家“重大新药创制”科技重大专项
资助项目( 2017ZX09101001) 件、设定方法、对称性问题以及检验界值与 P 值和样本量之间关系的
作者简介: 李新旭( 1978 - ) ,男,副研究员,主 考虑。
要从事药品的技术审评工作
1 检验界值的概念
通信作者: 王骏,研究员
MP: ( 010) 85243094 优效试验是指验证试验药的疗效优于对照 ( 阳性对照药或安慰
E - mail: wangj@ cde. org. cn 剂) 的试验,等效试验是指验证 2 种或多种治疗的差别大小在临床
2488 中国临床药理学杂志
第 35 卷 第 19 期 2019 年 10 月( 总第 297 期)
图1 优效、等效及非劣效试验与检验界值
Figure 1 Superiority,equivalence and non - inferiority trials 图2 检验界值的绝对度量和相对度量
and their margins Figure 2 The absolute and relative measures of margins
Chin J Clin Pharmacol 2489
Vol. 35 No. 19 October 2019( Serial No. 297)
表1 采用固定界值法设定非劣效界值的示例
Table 1 The examples of using the fixed margin method to define the non - inferiority margins
高优指标 低优指标
历史试验指标 事件率差值及 95% CI 事件率比及 95% CI 事件率差值及 95% CI 事件率比及 95% CI
( 阳性对照组 - 安慰剂组) ( 阳性对照组/ 安慰剂组) ( 阳性对照组 - 安慰剂组) ( 阳性对照组/ 安慰剂组)
Meta 分析结果 3. 75% ( 1. 96% ,
5. 54% ) 2. 77( 1. 90,
4. 03) - 3. 75% ( - 5. 54% ,- 1. 96% ) 0. 36( 0. 25,
0. 53)
M1 1. 96% 1. 90 - 1. 96% 0. 53
r 0. 5 0. 5 0. 5 0. 5
M2 - 0. 93% 0. 73 0. 93 1. 37
高优指标 低优指标
当前非劣效试验指标 事件率差值及 95% CI 事件率比及 95% CI 事件率差值及 95% CI 事件率比及 95% CI
( 试验组 - 阳性对照组) ( 试验组/ 阳性对照组) ( 试验组 - 阳性对照组) ( 试验组/ 阳性对照组)
试验结果 1. 25% ( - 0. 54% ,
3. 04% ) 1. 16( 0. 98,
1. 38) - 1. 25% ( - 3. 04% ,
0. 54% ) 0. 86( 0. 75,
1. 06)
下限 -0. 54% > M2 ( - 0. 93% ) , 下限 0. 98 > M2 ( 0. 73) ,
非劣效 上限 0. 54% < M2 ( 0. 93% ) ,非 上限 1. 06 < M2 ( 1. 37) ,非劣效
试验结论
非劣效结论成立 结论成立 劣效结论成立 结论成立
表2 采用综合法进行非劣效检验时原假设和统计量
Table 2 The null hypotheses and statistics of non - inferiority tests when using the synthesis method
高优指标 低优指标
度量类型
原假设( H0 ) 统计量( 拒绝 H0 ) 原假设( H0 ) 统计量( 拒绝 H0 )
绝对度量
相对度量
不同,即试验药与安慰剂的疗效差异大于与阳性对照 得 到 非 劣 效 结 论,则 对 非 劣 效 的 判 断 会 更 有
[34]
药的差异,在其他各方面条件相当时,与安慰剂比较 说服力 。
的优效试验的样本量一般小于与阳性对照药比较的 对非劣 效 界 值 的 设 定 主 要 基 于 对 历 史 数 据 的
[22,
30 - 31]
等效和非劣效试验 。 因此,在实践中,与阳性 Meta分析。申办方在检索历史文献时需要考虑文献
对照药比较时多选择等效或非劣效试验,而优效试验 的选择偏倚、发表偏倚等以及既往试验的设计、临床
[35]
多选择安慰剂作为对照。 由于等效试验是双侧检验 实践、试验结果等的恒定性 。 当缺乏历史数据而
而非劣效试验是单侧检验,在包括检验界值在内的各 采用德尔菲法时,应该严格按照该方法的要求收集信
[36]
方面条件相当时,等效试验所需的样本量大于非劣效 息并进行科学分析 ,以避免检验界值设定的主观
[8 - 9]
试验 。 性和随意性。
以非劣效试验为例,检验界值的较小变化可能导 在阐述检验界值的对称性以及检验界值与 P 值
致样本量的较大变化。 保守的非劣效界值需要更多 的关系时,讨论了在优效试验中事先设定临床上认可
的样本量来检测差异,但随着非劣效界值的增加,所 的检验界值 ( 优效界值 ) 的必要性。 这也符合国际人
需样本量减少,获得非劣效结论的可能性变大,这对 用药品注册技术协调会 ( ICH) E10 中阐述的“统计推
[8 - 9, 32] [37]
于药品临床试验的申办方极具诱惑力
15,
。 但是 断和临床判断 ”相结合的理念 。 当把优效试验视
过大的非劣效界值会超出可接受的试验药和阳性对 为差异性检验时,属于“统计推断 ”; 当为了避免医师
[30]
照药之间的临床疗效差异的限度 。 当通过检验界 在临床实践中对试验结果的解读产生困惑或者避免
值设定方法推导出较小的非劣效界值从而产生较大 申办方和监管机构事后讨论无法达成一致意见而考
样本量时,申办方不应该为了降低样本量而人为扩大 虑事先设定优效界值时,属于“临床判断”。
非劣效界值,而是应该仔细研究所收集到的历史数据 本文主要基于疗效终点介绍了对药物临床试验
是否满足恒定假设,是否存在“生物爬行现象 ”,以及 中预设检验界值的考虑。 对于基于安全终点的试验,
是否适用于当前试验等,从中筛选出可靠的历史数 本文对检验界值的考虑也可供其参考 。
[10]
据,重新推导出合理的非劣效界值和样本量 。这
参考文献:
些考虑也适用于等效和优效试验的检验界值与样本
[1 ] ALTHUNIAN T A,DE BOER A,KLUNGEL O H,et al. Methods
量之间的关联。
of defining the non - inferiority margin in randomized,double -
8 讨论
blind controlled trials: A systematic review [J]. Trials,2017,18
设定检验界值的目的是确保在试验药至少优于 ( 1) : 107.
安慰剂的基础上对试验药和阳性对照药的疗效进行 [2 ] LE HENANFF A,GIRAUDEAU B,BARON G,et al. Quality of
比较,即确保试验具有足够的检定灵敏度 ( assay sensi- reporting of noninferiority and equivalence randomized trials [J].
tivity) [14]
。合理的检验界值取决于适当的设定条件 295( 10) : 1147 - 1151.
JAMA,2006,
[3 ] SAAD E D,BUYSE M. Non - inferiority trials in breast and non -
和方法,而检验界值的合理与否又影响到样本量估算
small cell lung cancer: Choice of non - inferiority margins and other
和试验结论的正确与否。 因此,在药物临床试验设计 statistical aspects [J]. Acta Oncol,2012,
51( 7) : 890 - 896.
阶段需要对检验界值的设定进行充分考虑 。 [4 ] PARIENTI J J,VERDON R,MASSARI V. Methodological standards
虽然在阐述恒定假设的概念时也是以统计评价 in non - inferiority AIDS trials: Moving from adherence to compliance
这也可能意味着试验组相对于对照组有 50% 的事件 The ( not so) subtle distinction [J]. Trials,2017,
18( 1) : 278.
[13,
30] [7 ] INTERNATIONAL CONFERENCE ON HARMONISATION OF TECH-
率的增加或减少 。有研究显示,在不同的非劣效
NICAL REQUIREMENTS FOR REGISTRATION OF PHARMACEUTI-
界值的绝对度量水平上,非劣效界值的相对度量水平 CALS FOR HUMAN USE( ICH) . ICH harmonised tripartite guideline:
[33]
与对照组的观察事件率呈现不同的对应关系 。 如 Statistical principles for clinical trials ( E9) [EB / OL]. Geneva,Swit-
果在非劣效界值的绝对度量和相对度量水平上均能 1998 - 02 - 05 [2019 - 08 - 22]. http: / / www. ich. org /
zerland: ICH,
Chin J Clin Pharmacol 2493
Vol. 35 No. 19 October 2019( Serial No. 297)
fileadmin / Public _ Web _ Site / ICH _ Products / Guidelines / Efficacy / E9 / 17( 1) : 61 - 73.
Step4 / E9_Guideline. pdf. [24] DINUBILE M J. Bias and asymmetry in sequential noninferiority -
[8 ] KERAI S. Equivalence and non - inferiority trials in asnapshot superiority trial designs [J]. Clin Infect Dis,2013,56 ( 12 ) :
[J]. J Ayub Med Coll Abbottabad,2017,
29( 3) : 371 - 372. 1841 - 1842.
[9 ] ZHONG J,WEN M J,KWONG K S,et al. Testing of non - infe- [25] TURNER J R,DURHAM T A. Must new drugs be superior to those
riority and superiority for three - arm clinical studies with multiple already available? The role of noninferiority clinical trials [J]. J
experimental treatments [J]. Stat Methods Med Res,2018,
27( 6) : Clin Hypertens ( Greenwich) ,2015,
17( 4) : 319 - 321.
1751 - 1765. [26] HUSON L. Statistical assessment of superiority,equivalence and
[10] SCHUMI J,WITTES J T. Through the looking glass: understanding non - inferiority in clinical trials [J]. Clin Res Focus,2001,12
non - inferiority [J / OL]. Trials,2011,12: 106. 2011 - 05 - 03 ( 5) : 31 - 34.
[2019 - 08 - 22]. https: / / trialsjournal. biomedcentral. com / arti- [27] KRAEMER H C. Another point of view: Superiority,noninferiority,
cles /10. 1186 /1745 - 6215 - 12 - 106. and the role of active comparators [J]. J Clin Psychiatry,2011,
72
[11] CCTS 工作小组,夏结来 . 非劣效临床试验的统计学考虑 [J]. ( 10) : 1350 - 1352.
29( 2) : 270 - 274.
中国卫生统计,2012, [28] CHRISTENSEN E. Methodology of superiority vs. equivalence trials
[12] ALTHUNIAN T A,DE BOER A,GROENWOLD R H H,et al. and non - inferiority trials [J]. J Hepatol, 2007,46 ( 5 ) :
Defining the noninferiority margin and analysing noninferiority: An 947 - 954.
overview [J]. Br J Clin Pharmacol,2017,
83( 8) : 1636 - 1642. [29] MYLES P S. What’s new in trial design: Propensity scores,equiva-
[13] MAURI L,D'AGOSTINO R B S R. Challenges in the design and lence,and non - inferiority [J]. J Extra Corpor Technol,2009,
41
interpretation of noninferiority trials [J]. N Engl J Med,2017,
377 ( 4) : P6 - 10.
( 14) : 1357 - 1367. [30] MURTHY V L,DESAI N R,VORA A,et al. Increasing proportion
[14] U. S. FOOD AND DRUG ADMINISTRATION. Non - inferiority of clinical trials using noninferiority end points [J]. Clin Cardiol,
clinical trials to establish effectiveness: Guidance for industry 35( 9) : 522 - 523.
2012,
[EB / OL]. Silver Spring,MD,USA: U. S. Food and Drug Admi- [31] ERNST E. Equivalence and non - inferiority trials of CAM [J].
ni-stration,2016 - 11 - 30 [2019 - 08 - 22]. https: / / 1( 1) : 9 - 10.
Evid Based Complement Alternat Med,2004,
www. fda. gov / downloads / Drugs / Guidances / UCM202140. pdf. [32] GLL ,TEKINDAL M A. Sample size for non - inferiority tests
[15] FLEMING T R. Current issues in non - inferiority trials [J]. Stat for one proportion: A simulation study [J]. J Mod Appl Stat
27( 3) : 317 - 332.
Med,2008, 17( 1) : eP2475.
Methods,2018,
[16] EVERSON - STEWART S,EMERSON S S. Bio - creep in non - [33] TUNES DA SILVA G,LOGAN B R,KLEIN J P. Methods for e-
inferiority clinical trials [J]. Stat Med, 2010,29 ( 27 ) : quivalence and noninferiority testing [J]. Biol Blood Marrow
2769 - 2780. 15( 1 Suppl) : 120 - 127.
Transplant,2009,
[17] ODEM - DAVIS K,FLEMING T R. A simulation study evaluating [34] HEAD S J,KAUL S,BOGERS A J,et al. Non - inferiority study
bio - creep risk in serial non - inferiority clinical trials for preserva- design: Lessons to be learned from cardiovascular trials [J]. Eur
tion of effect [J]. Stat Biopharm Res,2015,
7( 1) : 12 - 24. 33( 11) : 1318 - 1324.
Heart J,2012,
[18] VAVKEN P. Rationale for and methods of superiority,noninferiori- [35] COMMITTEE FOR MEDICAL PRODUCTS FOR HUMAN USE
ty,or equivalence designs in orthopaedic,controlled trials [J]. ( CHMP) . Guideline on the choice of the non - inferiority margin
469( 9) : 2645 - 2653.
Clin Orthop Relat Res,2011, [EB / OL]. London,
UK: European Medicines Agency,2005 - 07 - 27
[19] HILLS R K. Non - inferiority trials: No better? No worse? No [2019 - 08 - 22]. http: / / www. ema. europa. eu / docs / en_GB / docu-
change? No pain? [J]. Br J Haematol,2017,
176( 6) : 883 - 887. ment_library / Scientific_guideline /2009 /09 / WC500003636. pdf.
[20] WALKER E,NOWACKI A S. Understanding equivalence and non- [36] POWELL C. The Delphi technique: myths and realities [J]. J Adv
inferiority testing [J]. J Gen Intern Med,2011,
26( 2) : 192 - 196. 41( 4) : 376 - 382.
Nurs,2003,
[21] AL DEEB M,AZAD A,BARBIC D. Critically appraising noninfe- [37] INTERNATIONAL CONFERENCE ON HARMONISATION OF TECH-
riority randomized controlled trials: A primer for emergency physi- NICAL REQUIREMENTS FOR REGISTRATION OF PHARMACEUTI-
cians [J]. CJEM,2015,
17( 3) : 231 - 236. CALS FOR HUMAN USE ( ICH) . ICH harmonised tripartite guideline:
[22] SCOTT I A. Non - inferiority trials: Determining whether alternative choice of control group and related issues in clinical trials ( E10 )
treatments are good enough [J]. Med J Aust,2009,190 ( 6 ) : [EB / OL]. Geneva,Switzerland: ICH,
2000 -07 - 20 [2019 - 08 - 22].
326 - 330. http: / / www. ich. org / fileadmin / Public_Web_Site / ICH_Products / Guide-
[23] LIU G F. A dynamic power prior for borrowing historical data in lines / Efficacy / E10/ Step4/ E10_Guideline. pdf.
noninferiority trials with binary endpoint [J]. Pharm Stat,2018, ( 本文编辑 戴荣源)