下一代试验设计：用真实世界数据补充临床试验

核心要点

模拟、仿真和合成代表了三种不同的合成患者范式，范围从重加权的外部对照到基于大量异质数据资产训练的机制/统计疾病模型和生成式AI。
计算机模拟队列在加速证据生成、长期终点预测、监管/卫生技术评估策略（包括亚组和标签优化）以及指导临床应用的实际效果评估等方面提供价值。
采用贝叶斯历史对照的自适应设计可以大幅减少难招募人群的样本量，在标准治疗快速演变时实现早期停药规则和更快的指南相关结论。
整合RCT和RWD的长周期预测可以通过模拟多年轨迹和不良事件负担来解决监管机构对持久性和安全性的担忧，指导上市后安全性研究(PASS)和上市后有效性研究(PAES)承诺。
基于自然病史、暴露效应和治疗路径构建的预竞争性、共享模拟平台可能在可接受性、维护性和可重复性方面优于临时模型，满足监管机构和赞助商的需求。

随着创新性临床试验设计日益受到重视，Phastar战略咨询主管Billy Amzal探讨了如何有效使用真实世界数据，分享了实用案例，并展望了患者模拟器和合成患者的未来。

真实世界数据(RWD)正在变革临床研究，通过补充现有随机对照试验(RCT)数据来降低研究风险并提高结果普适性。随着监管机构为其使用制定更明确的标准，创新性设计正日益获得认可。

然而，药物开发者必须回答关键问题，以确保可行性并成功实施。这些问题包括：在哪些应用场景和条件下最适合使用RWD，哪些是最有效的RWD来源和统计方法，以及如何建立更可持续的数据增强方法。

合成患者应用的创新

近年来，更强大的算法、更快的计算机和更便捷的标准RWD获取渠道，已在合成患者创建方面带来了显著创新。AI算法从RCT和RWD中学习，通过三种主要方式生成合理的合成患者——模拟、仿真和合成。

模拟应用AI将研究参与者与历史或外部数据进行匹配。它仅使用现有和历史数据，通过组合和重新加权结果来生成稳健的对照组。方法包括匹配和加权方法，如在使用真实世界数据时采用的逆概率治疗加权。

仿真使用现有数据和证据，通过算法构建疾病和药物效应模型进行插值或外推。此类模型使用来自多个数据源的患者级别和汇总数据构建。推断和数据整合方法包括贝叶斯疾病进展和预测建模、试验模拟、因果推断以及生成对抗网络(GANs)。

合成使用生成式AI算法从大型数据源（包括出版物、汇总和患者级别数据源）中学习。方法包括大型语言模型(LLMs)、深度学习(DL)和机器学习(ML)。

Kaabachi等人于2025年发表的关于合成数据生成器(SDG)方法生态系统的系统综述发现，约40%的合成患者是通过GAI和GAN方法生成的。更大比例是通过非GAN方法生成的，包括序贯树、贝叶斯网络和统计建模。

计算机模拟试验或队列的价值

对药物开发者而言，计算机模拟(in silico)试验或队列的影响可分为四大类：加速证据生成、预测长期效益/风险和药物价值、确保监管和HTA讨论、优化医疗实践和价值。

加速证据生成是最被理解的价值驱动因素，因为它能够进行简化的数据收集和更智能的试验设计。然而，在这一类别中，我们还应考虑如何丰富试验设计、确保结果可推广至真实世界人群，以及最大限度降低后续试验风险。

长期效益/风险预测关乎于将短期终点指标投射至长期结果。例如，从3期试验结果预测可能影响某国授权或报销决策的公共卫生影响。

如果考虑监管和HTA讨论，计算机模拟疾病队列或试验模拟可优化标签保护。它还可以帮助识别高价值亚组，并设计定价协议，其中价格直接源于药物在市场上的表现。

最后，如果获批药物未被处方或被误用，从而未能给患者带来益处，那么该药物对卫生系统的医疗和经济价值就非常低。使用RWD增强的试验可以捕捉这种实际效果，从而支持关于正确终点指标、人群等方面的决策。

这些类别中的每一个都有可映射至卫生机构接受度和熟悉度的用例。例如，如果我们考察加速证据生成，特别是外部对照臂，模拟已在指南中得到认可，仿真已有导致决策的试点项目，而合成则处于探索性使用阶段。然而，较新的基于AI的合成方法目前广泛处于探索阶段，除了一些关于数据隐私和匿名化的用例，这些可以通过特定AI算法实现。

案例研究展示影响

RWD建模和患者合并在临床试验中的有力应用体现在对现有试验数据的增强上。以下案例研究展示了创新方法如何实现试验加速、提高监管成功几率并增加医疗价值。

案例研究1：带自适应设计的历史对照臂 在围产期HIV传播预防方面，尤其是在中低收入国家，仍有很高的未满足需求。然而，在预防试验中招募高风险孕妇很困难。此外，HIV预防的标准治疗(SoC)在试验实施过程中可能变化非常快。为克服这些挑战，需要一种高效的设计，利用SoC和预防治疗效果的大量历史数据。选择的解决方案是使用贝叶斯荟萃分析和历史数据建模的自适应单臂试验设计来模拟对照组，基于达到足够传播率效果概率的早期停药规则。与标准随机对照试验相比，这种创新方法将总样本量减少了五分之一。该方法取得了成功的试验结果并产生了公共卫生影响，改变了世界卫生组织(WHO)关于HIV传播预防的指南。基于平台试验设计和SoC上RWD整合的类似方法现在正考虑在非洲应用。

案例研究2：用于监管提交的长期效益/风险预测 一项成功的早期前列腺癌3期试验显示，与主动监测相比，新疗法在无进展生存期(PFS)和组织学方面表现出优越性。然而，欧洲药品管理局(EMA)对长期安全性和效益/风险比提出质疑。利用RCT和真实世界数据建模长期疾病和结果进展，用于构建灵活的外部对照，以预测随时间推移的勃起功能障碍和尿失禁等效益/风险结果。队列模拟用于比较超过五年的不良事件发生率方面的治疗策略，分层分析优化了标签定义。患者模拟对获得市场授权至关重要，表征了长期效益风险，并为PASS和PAES要求提供了依据。

案例研究3：优化心力衰竭治疗转换时间以最大化药物效果 新的心力衰竭药物在试验中优于SoC，但在现实世界中观察到较差的相对效果，导致患者医疗获益和药物赞助商经济回报不佳，特别是在实施基于绩效定价的国家。有必要证明何时以及针对谁转换治疗以最大化医疗价值。从RCT和RWD建模了患者路径和疾病进展。模拟并比较了各种治疗序列在住院率和死亡率方面的表现，包括不同亚组中的差异转换策略。研究人员发现早期转换能最大化医疗价值和护理效率。结果被用于更好地设计基于结果的定价并指导医疗实践，以提高效果，将住院率降低30%至40%。

患者模拟器的更可持续方法

上述案例研究有助于展示计算机模拟试验如何向患者和卫生系统展示影响，以及实现开发中药物的全部价值。然而，要真正推动RWD的这种使用，我们需要从临时项目转向识别模式，并建立开发、使用和维护此类患者模拟器的标准框架。临时方法在卫生机构中的可接受性较低，通常只在很短的时间窗口内有效。这导致了巨大的投资和不确定的回报。

当我们转向更可持续的解决方案时，可以构建模拟平台，从特定疾病中最适合目的的来源收集真实世界证据，并能够以跨公司和利益相关者共享的方式开发、维护和验证疾病和护理模型。这将使在预竞争阶段模拟虚拟队列成为可能——不是针对特定开发中的药物，而是针对整个研究和公共卫生社区。

这种方法所需的三个支柱始终相同——建模自然病史、建模药物和暴露效应、模拟患者疾病和护理。这项工作已经在进行中，例如通过Critical Path Institute与KOL、监管机构如EMA和FDA以及其他许多利益相关者合作，因此我相信在接下来的几年里我们将看到更多发展。

生成式和代理式AI是合成患者的未来吗？

我想通过展望更远的未来并分享一个更具挑衅性的观点来结束本文——使用AI仅从公共汇总信息生成合成患者队列，就像ChatGPT所做的那样。当历史研究中的患者级别数据可用时，GANs和深度学习已被测试用于从此类现有患者级别数据中学习，以生成类似的合成患者。这在计算上很密集，需要难以获取的患者数据进行训练，并面临数据隐私问题。

我们最近探索了类似ChatGPT的LLM是否能从PubMed中学习足够多，并生成具有个体轨迹和结果的合成患者队列。将提示输入LLM以生成合成数据。通过将结果与阿尔茨海默病和帕金森病的真实队列数据进行对比来评估性能。选择这些疾病是因为可以获取大型队列、记录良好的患者表格数据和大量已发表的试验。这为学习提供了高潜力。我们在患者合成中通常使用的三个维度——保真度、隐私和效用——方面比较了队列。

结果显示，没有任何患者级别数据的LLM与在丰富数据上训练的最先进的DL方法相比表现良好。虽然保真度通常略低，但隐私和效用表现良好或非常好。

需要进行更大规模的评估才能确定结果是否能在更广泛范围内复制。在缺乏患者级别数据的情况下，我们还需要验证和监管框架。然而，这让我们一窥未来五到十年可能的样子，这要归功于更广泛的数据访问和更智能的算法。

来源

医疗合成数据中隐私和效用指标的范围综述。美国国家医学图书馆 2025年1月27日。

【全文结束】

下一代试验设计：用真实世界数据补充临床试验The Next Generation of Trial Designs: Supplementing Trials with Real-World Data | PharmExec