
• 从“原则上允许”转向“规范实操落地”;
• 先验分布设定是贝叶斯统计应用的核心与争议难点;
• 在应用上存在报告规范性不足、专业人才缺口等问题;
• 贝叶斯统计并非可替代经典频率学派,二者是互补共存关系。
今年1月,FDA、EMA和NMPA先后出台贝叶斯统计相关指导原则。且在今年1月JPM会议上,FDA局长Marty Makary也强调了贝叶斯统计在提升临床试验速度和监管审评效率,以及减轻审批负担方面的重要作用。
这释放了一个信号:经典统计学(频率学派)统计方法的“强风险把控”,已不能满足现阶段精准医疗、提高临床研究效率的需求,而贝叶斯统计具有突破传统学派局限、实现适应性设计的潜力,正式从“原则上允许”转向“规范实操落地”。
指导原则出台后,对于中小型药企而言,贝叶斯统计更容易上手,尤其是采用连续性管线布局策略的药企,可以更充分地利用此前积累的相关数据。
节省样本量,缩短研发周期
复旦大学附属中山医院黄丽红研究员在采访中这样概括贝叶斯统计相较经典统计学的主要优势:“贝叶斯统计可使得既往数据和既往经验得到概括和应用,通过先验分布合理借用外部信息(如罕见病研究借用历史对照、儿童药借用成人数据等),在当前研究样本量有限时,仍能提升估计可靠性,或在保持统计效能不变的情况下减少样本量,缩短研发周期。”
过去,历史临床数据在申报时多只能作为参考材料,难以转化为当前临床试验的硬指标。而贝叶斯统计可以使这些历史数据转换为当前试验的“有效样本”。
例如,在CCR2/CCR5拮抗剂PF-04634817针对糖尿病肾病的一项II期研究中,通过将两项历史研究的Meta分析数据构建为对照组的先验信息,等效于额外引入80例虚拟安慰剂受试者,最终,实际试验中安慰剂组人数从112例减少至56例——这使得实际招募的患者人数减少一半,降低了研究成本。
贝叶斯统计另一个显著特点是:可持续加入新证据,不断更新后验概率。“通过临床创新适应性设计(adaptive design),实时整合累积数据进行动态决策,可显著提升效率与伦理合理性。”黄丽红表示。
I-SPY2乳腺癌药物平台试验(II期)是这一优势的经典案例。该试验在单一监管框架下同步评估多种创新疗法,深度整合先验信息(含生物标志物特征、影像学监测数据等)与试验实时积累的数据,通过贝叶斯算法持续更新药物疗效预测结果,为动态决策提供依据。
在试验设计上,采用共用对照组设计,避免了传统试验中各组单独设置对照的样本浪费。对经阶段性评估确认无效的药物,该平台可以快速终止相关试验,同时允许新候选药物无缝加入。据负责I-SPY2试验的机构Quantum Leap官网公开的信息,该研究已经测试了 30 多种候选药物,在已完成评估的 25 款药物中,10 款成功“毕业”进入Ⅲ期,Keytruda、Tukysa、Imfinzi和Dato-DXd等产品均受益于该研究。
贝叶斯统计还有另一个优势:经典统计学仅提供简单的“接受或拒绝”假设的决策,而贝叶斯统计则是基于后验分布,提供了假设成立的概率,将可能性大小进行了量化。研究者可以以此评估某个估计值超过最小临床重要性差异的概率,来判断治疗效果是否具有真正的临床价值。

整理|研发客
最大的争议:既能借力也可能失真
先验分布的确定是贝叶斯统计应用的核心问题,也是最受争议的难点,因为先验分布的构建与选择将直接影响推断结果。
根据信息量,先验信息可分为无信息先验与信息先验。在实践中,无可靠历史数据的场景中,被较多采用的是无信息或弱信息先验,可最大限度保证当前样本观测数据的主导地位;当存在充分的前期研究证据时,采用经过严格论证的强信息先验,不仅能提升统计效能,还可能显著优化研究设计。
对先验信息的合理应用是贝叶斯统计的核心优势所在,但也存在主观性风险。
中美欧出台的贝叶斯统计指导原则均强调,先验分布的构建与选择必须遵循“证据驱动、过程透明与事前预设”的原则,而非主观选择;要求申办方系统性识别和审查外部信息,在临床与统计多学科团队参与下完成先验设定,并预先指定先验来源及构建方法,从源头降低选择性偏倚风险。
贝叶斯统计的信息借用能力,高度依赖外部数据的质量与相关性。各指南均强调,在设计阶段,必须证明贝叶斯统计的科学合理性,评估外部数据的相关性(可交换性)与数据质量。
黄丽红提到,外部数据与当前临床研究人群、临床实践环境的一致性评价,是应用中的重要挑战。若外部数据与当前试验的人群特征、治疗方案、终点定义等存在差异,盲目借用可能导致结论失真。
各指南均要求申办方在设计阶段通过模拟研究预判潜在冲突,并采用动态借用或敏感性分析调整借用强度。通常建议借用的有效样本量(effective sample size,ESS)不能超过现有样本量,以免出现先验主导当前试验结果。
一个典型的案例是心血管临床试验(BIOSTEMI),研究者基于该试验历史亚组数据构建信息先验,同时设定非信息先验,并将两者按1∶1权重混合生成稳健先验,既保留历史证据的指导性,又避免了对历史数据的过度依赖。
现实的挑战:专业人才缺口和执行规范
“在未来的实践中,贝叶斯统计与经典统计学两者应是互为补充,并行共存的关系。”黄丽红表示。她也提到,贝叶斯统计“在临床实践中仍面临技术实施、人才储备、监管适配等多个层面的挑战” 。
此前,ICH E9/E11A/E20已认可贝叶斯统计,但统一、可执行的操作框架却一直缺席。一项基于《贝叶斯在临床研究中的应用报告(ROBUST)》的调查显示,17项采用贝叶斯统计的医疗器械相关研究中,仅24%报告了先验分布,18%报告了敏感性分析,35%解释了模型以及59%的研究报告了可信区间。这在一定程度上表明,贝叶斯研究的报告规范性仍有待提升。
这也恰恰是监管指南出台的背景——通过规范化报告要求,确保贝叶斯统计的透明性与可重复性。在当前指南中明确的潜在应用场景包括:小人群研究、成人信息向儿童外推,信息借用和适应性试验等。“在选择贝叶斯统计方法时需要进行适用性评价,明确其在当前应用场景下相对于频率学派的优势。只有在适宜的场景下规范应用,才能真正发挥贝叶斯统计方法的科学价值。”黄丽红告诉研发客。
贝叶斯统计的难点本质是“不确定性的量化与控制”,既要利用外部信息提升试验效率,又要避免引入主观偏倚;既要满足监管对严谨性、可重复性的要求,又要适配可解释的推断逻辑。而解决这些难点,需跨学科协作(统计、临床、监管),提前开展模拟验证,并严格遵循预设方案与透明化报告原则。这对研究团队的技术能力提出了更高的要求,而目前业内贝叶斯统计相关人才数量存在一定的缺口。
“业内接受过贝叶斯统计方法系统培训的统计师并不多,绝大多数统计师长期学习和应用频率学派方法,对于贝叶斯统计方法相对比较陌生。”黄丽红坦言,“贝叶斯的应用和推广还需要一个积累和提升的过程。”
编辑 | 姚嘉
yao.jia@PharmaDJ.com
访问研发客网站,深度报道和每日新闻抢鲜看