美国食品药品监督管理局推动将贝叶斯统计方法纳入药物和生物制品临床试验的举措本周获得《美国医学会杂志》(JAMA)特别关注。
《JAMA》刊发了三篇观点文章——两篇欢迎该局今年1月发布的指南草案,另一篇则提出审慎建议。
西雅图华盛顿大学的托马斯·弗莱明博士是持谨慎态度文章的作者之一,他长期致力于临床试验标准统计方法(即"频率学派"方法)的研究。另两篇文章的作者则支持贝叶斯方法,包括纽约哥伦比亚大学的安德鲁·格尔曼博士和休斯顿德克萨斯大学MD安德森癌症中心的李杰克博士。
频率学派与贝叶斯方法的核心差异何在?频率学派假设药物效果是固定未知常数,从"药物无效"的零假设出发;而贝叶斯方法则将药物效果视为概率分布。
格尔曼和李杰克向MedPage Today解释,贝叶斯分析会整合先验证据(称为"先验信息"),并与新数据结合以更新认知,即"后验概率"。
格尔曼表示:"研究中的一个问题是,较大效应易被统计检出,而较小效应常低于检测阈值。因此报告结果往往高估实际效果。采用贝叶斯方法时,显著的正向效应会被适度向零值修正...但对于微小效应,仍保留其有效的一定概率,而非仅因未达统计显著阈值就判定无效。"
李杰克以天气预报作类比:夜间查看预报显示次日早晨40%降水概率,若次日清晨见乌云密布,可能将概率更新为80%而携带雨具;若晴空万里则可能修正为10%概率而不带雨具。
然而关键争议在于:频率学派认为贝叶斯分析所需的"先验信息"会引入偏倚,且其标准方法对I类错误(假阳性)的控制更优。弗莱明团队指出,贝叶斯方法在晚期或确证性试验中的应用迄今仅限于补充分析,"因学界认识到该方法实施不当可能损害证据标准与结果可靠性"。
格尔曼则强调:"所有统计学派均认同在研究设计中使用先验信息的必要性,无论是否采用贝叶斯方法。设计研究时需确保能检测到合理效应量...从这层意义看,现有设计已具贝叶斯思维,即使未正式采用该框架。"
李杰克指出肿瘤学领域已存在适应性临床试验设计,其本质即贝叶斯方法。"我们边进行边学习"的特性使其效果显著。生物统计学家在诊断测试的阳性/阴性预测值计算中也广泛采用贝叶斯方法。李杰克举例说明:即使检测具有95%灵敏度和特异性(他强调现实中不存在此类检测),仍需疾病流行率等"先验信息"计算预测值(即"后验概率")。
李杰克补充指出,弗莱明论文也承认在儿科或罕见病领域(因病例数过少难以开展充分效力的随机对照试验)贝叶斯方法具有价值。但两位专家均强调,贝叶斯分析中的"先验信息"质量至关重要。
李杰克还提到医生需要时间适应新术语体系。虽然他们已熟悉频率学派的P值和置信区间,但需逐步掌握贝叶斯方法的先验概率、后验概率及可信区间概念。
FDA关于药物和生物制品临床试验贝叶斯方法的指南草案历经多年制定。李杰克指出,尽管药品和生物制品审评中心采纳较慢,但器械与放射健康中心早在2010年就发布了器械试验的贝叶斯统计模型指南。他同时强调贝叶斯方法实际早于频率学派模型——贝叶斯定理得名于18世纪神职人员兼业余数学家托马斯·贝叶斯,其遗作于1763年(逝世两年后)发表,但直至1980年代计算机算力与算法提升后才得以广泛应用。
李杰克解释,20世纪20年代英国统计学家罗纳德·费希尔的工作推动频率学派方法成为临床试验主流,部分原因在于其计算更为简便。
弗莱明论文(合著者包括美国国家过敏与传染病研究所临床试验研究与统计部门专家)对FDA今年1月发布指南草案的新闻稿提出异议。该新闻稿将指南描述为"统计方法现代化",但弗莱明团队认为:"当前保障客观性与随机化优势的方法并非过时、守旧或思想封闭,而是基于科学原则保护证据完整性并确保科学结论稳健性,这些目标应被维护而非取代。"
【全文结束】

