蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 2267|回复: 6
收起左侧

[GMP相关] 专家委员会如何决定药的生死?

[复制链接]
宗师
发表于 2016-12-15 15:49:16 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 皇后 于 2016-12-15 19:10 编辑

专家委员会如何决定药的生死?2016-12-14

2016年8月8日,CDE起草了《药品注册审评专家咨询委员会管理办法》(征求意见稿),开始积极探索药品注册审评专家咨询委员会制度。

在美国,专家委员会(advisory committee)向FDA就新药申请提供独立的意见和建议,委员会中的专家委员一般在会议开始前45天收到FDA审评的资料,基于这些资料和信息,拥有投票权的专家会对药品申请进行表决,FDA大多数情况下会遵循投票结果。

同写意论坛第52期活动中,曾作为专家委员会成员的报告嘉宾,以肿瘤药物专家委员会(ancologic drugs advisory committee, ODAC)2016年9月14日的会议为台本,分饰角色,再现该场景。写意君特整理分享,现场文字录入难免瑕疵,仅供参考。

“很高兴看到CDE开始走上专家委员会这条路,这也是我们花这么长的时间从头到尾排练这个场景秀的原因。虽然ODAC成员的选择、专家资质的确定等涉及到政策、程序等,但如果这是真正的中国ODAC,但我相信在座的报告嘉宾都是有这个资格的。”饰被拒绝药物申办方的陈刚博士说。



申办方
陈刚博士饰

FDA审评人员
李宁博士饰

专家委员会
黑永疆博士
华烨博士
张丹博士
彭彬博士

患者代表
包骏博士饰


这次会议主要审评Spectrum 制药公司apaziquone的上市申请,apaziquone用于膀胱电切术之后灌注治疗,以降低非肌层浸润性膀胱癌的复发率。




图1  FDA专家委员会流程


疾病背景

在美国,胰腺癌是男性第四大癌症,每年新增膀胱癌患者76960例,死亡人数16390,当前患者587246,89%的患者年龄大于55岁,五年生存期是77.5%,是所有的肿瘤当中花费(从诊断到死亡)最多的。


图2 胰腺癌的分级及手术之后的生存期

《WHO 1973》《WHO/ISUP1998》和《WHO 2004》指南对胰腺癌进行了分级,根据临床和病理,将膀胱癌分为CIS、Ta、T1、T2、T3和T4。CIS指的是附着于膀胱内壁的膀胱癌壁,再深一层的胰腺癌是Ta,此时胰腺癌快要进入到结缔组织,T1是浸润到结缔组织,T2-T4已经浸润到肌肉组织,此时非常严重,治疗方法一般是把整个膀胱切除。


表1 胰腺癌的复发率

膀胱癌治疗费用高的原因是其复发率比较高,膀胱癌的标准治疗是经尿道膀胱肿瘤切除术加化疗,化疗包括卡介苗(Bacillus Calmette-Guérin,BCG)、塞替派(Thiotepa)、丝裂霉素C、多柔比星、表柔比星、戊柔比星和吉西他滨。术后会复发多次,长期循环下去,比较痛苦。尽管指南上推荐化疗药物灌注治疗,但通过对美国、欧盟和加拿大地区的病人调研发现,使用情况并不乐观。

apaziquone是一种烷化剂,在经尿道膀胱肿瘤切除术之后,将该药物灌注在膀胱。适应人群是Ta患者中G1和G2,此时肿瘤在表皮上面,尚未进入结缔组织,是相对早期的肿瘤。

申办方陈述

我将从以下四个方面来论证这是非常有价值的产品:第一,临床试验设计;第二,有效性;第三,安全性;第四,风险效益平衡。希望在座的专家能够公正客观地对于我们所得到的结果予以讨论,最终给病人一个选择的机会。

公司花了十五年的时间,搜集了大量的数据,完成了临床Ⅰ期、Ⅱ期和Ⅲ期试验,特别是临床Ⅲ期,经历了九年,所有试验共涉及1859个病人。


图3  Apaziquone的临床试验发展阶段

Ⅰ期临床的剂量反应中,12个膀胱癌患者(Ta,T1, G1-G2)中有8人观察到抗肿瘤活性(剂量为4mg/40mL),最大安全剂量为16mg/40mL。Ⅱ期临床招募了46个患者(Ta, T1, G1-G2),对4mg/40mL这个剂量有良好的耐受性。为Ⅲ期临床试验做了充分准备。


图4 患者治疗效果对比

刚才李宁博士已经从疾病和药理的角度做了描述,这是用Apaziquone的效果,通过比较膀胱表皮的光滑度,可以直观看出Apaziquone的疗效。

公司开展了两个全球多中心、双盲、随机对照性临床Ⅲ期试验,这两个试验(611和612)设计基本相同,都是在进行经尿道膀胱切除术之后灌注Apaziquone和对照剂,纳入1614个病人,临床终点如表2所示。

临床终点
指标
目标人群
判断标准
统计方法
置信区间
主要终点
两年内复发率
Ta,G1-G2 NMIBC
实验组比对照组复发率低12%
卡方检验
5%
次要终点
复发
时间
Ta,G1-G2 NMIBC
时序检验
HR值及95% CI
表2  611和612临床试验方案设计

当试验结果出来的时候,我们反思十年前由于缺乏经验,设计的过程中确实存在不如人意的地方。所针对的病人是Ta、G1以及G2的病人,都是偏轻的,病情重的必须要把膀胱切除。

试验主要终点是两年的复发率,通过膀胱灌注该药以后,希望病人两年期间疾病复发率有所降低。在设计的时候我们假设,用药和不用药相比,疾病的复发率能够降低12%。我们用了简单的卡方检验来检验主要终点,次要终点是疾病复发时间。

然而,主要终点的选择实际上丢失了信息。大家都知道,到达终点包含时间和事件发生两个方面。时间是非常重要的信息,即便两年内两组复发率都是100%,治疗组是在第二年复发,对照组是在第一年复发,两组的两年复发率是没有区别的,但药物却能延缓疾病复发一年时间。

疗效主要从三个方面展示:第一,主要终点的有效性;第二,科学评估两年之内的复发时间;第三,亚组试验结果。所谓的亚组试验就是药物灌注的时间应该小于还是大于30分。


表3  611和612试验病人分布情况

611和612是两个平行且相互独立的试验, FDA希望有两个研究来证明这个药品,这两个研究主要在美国和加拿大进行。


表4 病人的基本信息资料和基线数据

我们的baseline研究肯定是均衡的,就是说操作过程无瑕疵,不能从baseline中看到哪一个更支持我们的研究。

虽然说每一个临床研究都显示了非常好的临床收益,但是统计上都没有达到我们所希望的显著性结果。将两个独立且相同的研究合并在一起进行分析。


表5  611和612主要终点研究的试验结果


图5 合并研究的两年复发率和复发时间

两项研究结果进行合并之后,治疗效果增强了,两年复发率和复发时间的数据证据力度也增强了,P<0.05。

从证据链完备性(totality-of-the-evidence)角度对此说明,首先,我们承认试验结果没有跟预计的12%的假设达成一致,但这个假设是主观的数值,重要的是药物对病人是不是有益。两个临床研究都表明该药物是有临床价值的,基本上可以降低7%的复发率,有效性是非常一致的。

总得来说,把两年之内的复发率和复发时间作为终点,确实考虑不周。但这两个研究具有显著的一致性,我们纳入研究的病人比较多,且为双盲随机对照试验,特别是安全性数据,更能让我们坚信风险收益比处在比较高的水平。

这是亚组试验结果。我想强调的是灌注的时间小于和大于30分钟,确实有区别。


表6 611和612研究的亚组试验结果

这个研究的结论是长时间的膀胱灌注对病人是有好处的。灌注时间大于30分钟和小于30分钟相比,膀胱癌的复发率降低了10%-11%。这跟最开始的假设非常接近,并且统计都有显著性差异。如果给病人足够的灌注时间,马上就能呈现临床的意义。

在实验方案设计、给药过程和临床终点的选择上,因为缺乏经验,我们有很多东西需要反思。今天我们有足够的时间避免这些问题的发生,成功率将是100%。

下面是安全性数据。


表7  611和612研究的安全性数据

灌注Apaziquone和安慰剂的安全性没有显著差异。整体安全性来说,Apaziquone的耐受性比较好,在试验开始的30天没有患者死亡。

最后,药物的风险收益平衡。在定性描述的过程中,虽然早年预计两年之内的复发率是12%,试验结果显示只降低7%的复发率,但这个药物基本上是安全的。在没有安全性风险的情况下,任何被确认的临床疗效都是有临床意义的,请各位专家从这个角度考虑,给出一个合理的答案,再次感谢FDA在沟通合作中所付出的努力。

FDA陈述

大家好!首先,该药NDA的主要根据是611和612研究,这两个研究的设计完全一样。病人的选取是Ta中的 G1和G2分级,肿瘤最大直径小于3.5cm,数量不超过4个,病人在进行经尿道膀胱切除术后随机分成两组,一组灌注申报药物Apaziquone;另外一组用安慰剂,每三个月进行一次检查,观察复发率。


图6 611和612试验设计的策略

两个临床研究的主要终点都是两年的复发率,还有很多次要终点,次要终点的第一个因素是是复发的时间;第二个因素是疾病进展的时间;第三个是两年之内的疾病进展率。最主要的是临床终点是两年间的复发率。

临床统计分析计划(SAP)上面明确定义,要在两年后去检测出12%的复发率的差别,用的α是0.05,统计的方法是卡方检验(CMH)。

问题

首先,在这两个临床研究当中,接近20%的病人在两年的时候没有数据,是没有办法进行分析的,并且这些缺失数据的比例高于试验组与对照组之间的差异(6%)。


表8 611和612研究中的缺失数据

第二, FDA对试验结果有一些担心。不管从什么角度来看,依据我们之前定义并且达成一致的主要终点,这两个研究都是失败的。在主要终点已经失败的情况下,所有的分析都已经用光了5%的假阳性,都只能是探索性的分析。虽然申办方在分析中都加了一个P值,从临床和统计角度来说,这个P值是没有意义的。所有不在方案中确定的、控制了一类错误的post-hoc分析都是探索性分析。

表9  611和612研究中主要终点结果

理论上来说,Apaziquone和安慰剂是没有差别的。不管是611还是612,这两个临床研究的结果都是只有6.6%的差别,从研究效力的角度来看,5年的差异应该是14%。

该药物针对病情较轻的病人,根据次要终点的试验数据和申办方的观点,试验组和对照组的疾病复发时间是有显著性差异的(P=0.04),但所有统计学分析都基于主要终点的数据显著才有意义。622研究两年之内的复发时间没有显著差异(P=0.10),所以,无论主要终点分析还是次要终点分析,都不能让我们信服。


表10 611和612研究中次要终点结果

在假阳性率没有得到控制的情况下,临床终点的分析都只能证明假阳性非常高,不能用来证明疾病的有效性。两个试验设计都没有把复发时间作为临床终点,很多病人在24个月之后都没有继续跟踪,所以主要终点和次要终点都不能作为药品上市的依据。

为了证明药的有效性和安全性,申办方做了其他分析,都有存在的意义,但是我们并不认可分析结果。


图7  两个研究合并之后的分析

合并分析

合并之后,样本量会变大,直接的结果就是置信区间会变小,在这样的情况下,得到的p值也有可能变小,但治疗效果是不会变的,因此,很小的治疗效果都能看到比较小的p值。所以,不管什么样的临床研究,只要研究的基数比较大,都能发现非常小的差别,所以,在申办方没有验证假设的情况下,我们不能根据治疗效果的P值就确定治疗效果。这个合并研究已经用光了5%的假阳性,分析过程中可能增加了假阳性(虽然我们并不知道增加了多少),对我们来说这就是探索性研究。


表11 灌注时间对于疗效的影响

亚组分析

亚组分析确实能看到一个非常好的结果。灌注的时间是一个重要的因素,大于30分钟和小于30分种的灌注,无论是从复发率还是复发的时间,结果是不太一样的。但这个数据的最大问题是,这30分钟是怎么来的?这是非常主观。灌注时间可以从0分钟到两小时,不同的灌注时间可能会得到不同的结果,所以这只能作为参考,而不能作为临床证据。

所有的数据都可以帮助产生假设,或许灌注30分钟是临床上最好的效果,但这个试验并不足以证明。我们认为申办方应对疗效、Ⅰ期和Ⅱ期临床进行充分研究,与FDA达成一致,以临床灌注30分钟为治疗标准,开展一个随机对照临床试验,以产生足够的数据确定灌注时间大于30分钟是一个治疗方案,专家委员会再来考虑它的批准。

在药物审评中,ICH-E9指南规定,如果药品安全性和有效性的数据都来源于亚组分析,一般这个申请是不会被批准的,原因是所有的亚组分析都是比较武断的。ICH E3指南规定:亚组分析一般不能用来去挽救一个临床研究,但可以用于检验其他研究。一个临床研究做完之后,不能随便分成多个亚组,通过发现其中两个亚组有显著性差异,重新定义药品申请的适应证,这种申请一般不会被FDA批准。这样的亚组分析只能作为假设的依据,需要有足够的证据来证明亚组的选取是能站得住脚的,并且亚组的选择需要用准确的分析方法来证明。

结论

根据结果,我们认为两个研究都是失败的。有20%的数据缺失,降低6%的复发率是非常难以解释临床疗效的,如果缺失的数据中有部分人疗效不好,这个药物的疗效可能为0%。

另外,在主要终点失败的情况下,所有次要终点分析都没有控制一类错误,这种情况下,它的结论都是不可靠的。所以我们认为合并研究和灌注时间都是探索性分析,都只能作为下一个研究假设的依据。请各位专家对这个临床研究结果进行评价。

申办方澄清问题

华烨:纳入研究的病人只是Ta中的G1和G2,G3被排除在外,而G1和G2只占Ta的77%,这对你研究方案的差异的影响有多大?

陈刚:我们做了大量的研究,不认可FDA的结论,主要还是强调一致性,这个试验比较难做,也出现了一定程度的偏差,包括20%的缺失数据,尽管如此,我们还是可以证明人群和患者的结果具有一致性。我们不是不同意FDA所说的“在结果出来之后,谈显著性是不相关的。”我们强调的是证据的强度,所以我在后面用亚组分析不是来做结论,而是用于支撑药物的总有效性。

华烨:灌注手术之后停留多长时间开始灌注?30分钟指的是药物停留在膀胱里面30分钟?

李宁:手术以后立刻灌注,可以保留0到两小时。这是一次治疗,在膀胱内灌注30分钟,停留在膀胱一个小时。

彭彬:在这个研究中,主要终点和次要终点。因为肿瘤的金标准是总体生存率,在膀胱癌这个适应证上,是两年的复发率重要还是总体生存率更重要?FDA和申办方有没有一些其他的数据?

李宁:这个临床研究是十几年前设计的。在此之前,对该疾病没有现成的临床试验设计,当时主要终点和次要终点的设计都是申办方与FDA反复讨论协商的,,双方对选取两年的复发率为临床终点达成了一致。

黑永疆:在复发时间等临床终点方面,申办方是不是和FDA进行沟通,并达成了协议?

陈刚:2005年的时候我们和FDA进行了协商,但是当时大家都没有经验,经过多次沟通,长时间的争论,在试验方案设计和终点选择达成了一致,把复发时间作为支撑性的终点,这十年审评专家也发生了变化,负责这个药物的审评专家也有所变动。

黑永疆:试验方案的临床终点是两年期间的复发率和复发时间,真正的跟踪时间是多长?

陈刚:这是非常具体的问题,在方案设计中至少是两年的研究,当然20%数据缺失的原因是一部分病人,可能在六个月、八个月或者一年之后,因为各种原因,信息没有及时更新。

黑永疆:在灌注时间这个亚组分析中,试验方案是随机化的,611和612研究中试验组分别纳入了161、183个患者,基线是不是均衡的?


陈刚:这不是一个经过严格验证的分组,随机处理,不一定是均衡的。首先,为什么选择30分钟?因为我们和行业专家进行了大量的沟通,也结合现有的数据。第二,幸运的是,在这个亚组中,基线基本上是平衡的。

张丹:你们这两个研究是相互独立的研究,但是这两个研究的试验设计是非常相似的,你们当时有没有计划要做合并分析(pool analysis)?

陈刚:第一,当时就做几个研究与FDA沟通的时候,FDA审评人员给了很清晰的建议,做两个研究能够相互支持,所以实施过程中就设计了两个研究;第二,这两个研究不是相似,而是相同的研究,就是为了测试药品的有效;第三,早年和FDA沟通的时候,大家口头上觉得既然是相同的研究,就可以把合并分析作为结论性证据。反思过去,在和FDA沟通的时候,我们应该把所有的东西做成文件。

李宁:对于不是那么严重的疾病,比如Ta膀胱癌的G1和G2患者疾病,小于2%的病人两年以后疾病会浸润到肌肉层。当时FDA和一些工业届的统计师达成一个协议:两个独立的研究,每一个研究的p值都是0.05,也就是单侧0.025才有显著性,如果想要这两个独立的研究合并分析依然有同样的证据效力,就要用单侧0.00625作为P值,根据这个条件,即使你把两个研究放在一起,依然没有达到这个要求。

黑永疆:合并之后,显著性得到了提高,申办方强调证据链完备性,这是对的。该药品大概能降低7%的复发率(安慰剂的复发率是45%),这跟其他产品的差异也不是很大,比如说卡介苗,你认为这真的有临床意义吗?

陈刚:这也是我我所强调的风险收益比。试验组降低了7%的复发率,这个和12%的假设是有距离的,要从两个角度看这个问题:第一,早年的12%是我们和FDA以及专家沟通的结果,这也是非常主观的假设,大家看重的不是这个具体数值,更多是在当时的情况下,12%假设是一个比较好的选择;第二,这个药非常安全,在这种情况下,我们能看到的任何差异都应该考虑为临床价值。

华烨:考虑12%作为假设肯定有你们的理由,当时估计这个安慰剂的有效率大概大概是多少?

陈刚:安慰剂的有效率在当时和今天区别不是很大,如果你什么都不用,这个复发率是比较确定的,大概在45%。

公开听证

包骏:各位专家都看到了这些数据,我这里有两张照片,用后确实效果比较好,没有感觉到任何不适。虽然这个数字很少,只有63个人,但如果这是你的亲人,你们会不会让他去试用这个药?请专家们慎重考虑,所以我赞成。

表决

彭彬:我反对。申办者没有长期生存期的数据,而这个数据对主要和次要终点是至关重要的。

黑永疆:我反对。主要终点没有达到统计学显著性,两个试验都是失败的。这个药物有可能会有一定作用,但是它的证据强度不够大。

包骏:我赞成。这个药物确实有效,对患者是有利的,可以增加患者的选择。

华烨:我反对。我觉得是证据不够充分的。第一,这个差异不具有临床意义的显著性,当年讨论的12%,现在还是有意义的,因为安慰剂的复发率没有变化。从临床的观点来看,如果安慰剂的复发率是20%,那么药物可以降低6%复发率,这种情况还是可以考虑的,但是安慰剂的复发率已经有45%,并且还有一部分数据是缺失的,所以这个有效性不是很强;第二,半个小时的灌注时间能够有效降低复发率,但现在的数据不完整。因为这里面就只有一个剂量,我没有看到剂量-反应(dose-response)。

张丹:我反对。如果这是两个独立性研究,那么P值是不一样的,我认为可能需要一个额外的试验来作为支撑。我之前负责过一个研究,北美试验结果P=0.051,欧洲试验结果P=0.04,合并分析,P=0.045,依然被拒绝掉了。

万云涛:我赞成。根据药物的风险收益平衡,首先这个药非常安全,使用这个药并没有给病人带来任何不适,只是手术后再加半个小时的灌注。从医生的角度,病人的治疗药物选择非常少,所以可以给病人一定时间来尝试使用这个药品,然后建议申办方在药品上市后之后,完成上市后承诺(post-market commitiments)。具体说就是以30分钟的灌注为基础,完成一个随机对照研究。

杨大俊:我赞成。我在美国参加过很多这样的会,从早上八点到下午三四点,申办方可以有很长时间陈述观点,在座的专家提前45天拿到审评资料,有充分的时间做分析,所以专家是不会瞎说的。会议过程中,公司也有大量的数据去支撑他的假设,而不是简单地争论。

这是一个真实的案例,不是YES or NO那么简单。因为我没有45天来看这个案例,今天在这里只是做一个场景的回答。这两个研究,每个研究有600多例病人,从安全性和效果上来讲病人还是获益的多。为什么没有总体生存期这个指标?因为这个适应证针对的不是Ⅲ期或者是Ⅳ期的病人,病人生存期长,不能用OS做主要目标或者是次要目标,所以这些临床终点是和FDA讨论的,并不是自己设计的。现在并没有达到一个良性的结果,FDA不接受亚组分析,但可以作为一个依据来设计下一个研究,结果还是有意义的。


回复

使用道具 举报

药士
发表于 2016-12-15 15:55:26 | 显示全部楼层
回复

使用道具 举报

药士
发表于 2016-12-15 16:00:32 | 显示全部楼层
微信的图片   调用失败
回复

使用道具 举报

药徒
发表于 2016-12-15 17:43:15 | 显示全部楼层
回复

使用道具 举报

药生
发表于 2016-12-15 19:10:45 | 显示全部楼层
不要直接这么转微信,论坛不识别图片
回复

使用道具 举报

药徒
发表于 2016-12-15 22:45:14 | 显示全部楼层
太长了,实在看不下去了
回复

使用道具 举报

药徒
发表于 2016-12-16 10:24:02 | 显示全部楼层
学习了,谢谢分享!
回复

使用道具 举报

药神
发表于 2023-2-18 18:27:57 | 显示全部楼层
谢谢分享。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  京ICP证150354号  互联网药品信息服务证书编号: (京)-非经营性-2024-0033

GMT+8, 2024-11-13 23:32

Powered by Discuz! X3.4运维单位:苏州豚鼠科技有限公司

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表