在过去两年中,生成式人工智能(AI)已成为生命科学行业的重要战略优先事项,推动了药物开发和监管流程的创新。随着生成式AI现在能够加速临床文件、法规提交和内容生成,组织面临着双重挑战:确保数据和内容准备就绪,以及管理成功实施生成式AI所需的更广泛的组织变革。
在这一转型的核心是临床研究报告(CSR),这是药物开发过程中的关键文件。生成式AI有潜力自动创建CSR,减少手动工作量,提高准确性,并加快新疗法的上市时间。然而,为了充分利用生成式AI驱动的自动化,组织必须首先确保其内容生态系统已针对该技术进行了优化。这包括数据准备、内容准备、使文档处理过程符合法规要求,以及设计一个每个文档都有独特目的的内容生态系统。
数据准备
标准化数据格式对于确保准确性、可比性和法规合规性至关重要,也是自动化的基础。除了以标准研究数据表格模型(SDTM)和分析数据模型(AdaM)格式化患者级别的数据集外,CSR所需的不同研究和治疗领域的摘要级数据标准各不相同,即使在同一公司内部也是如此。尽管提供标准化临床数据的指南已经存在多年,但实施这些指南的努力仍在进行中。管理不同的研究设计和数据结构在实施生成式AI时需要额外步骤。
最佳实践是评估即将推出的产品组合,确定早期采用者和研究项目。这将有助于识别最能代表未来项目的过往研究。另一种方法是使用匿名数据和文档,这些数据和文档代表了未来的业务状态或标准。
内容准备
生成式AI现在可以快速起草一些制药法规文件。然而,制药公司如果不定义和简化内容生态系统并去除不必要的努力,将无法充分发挥使用生成式AI自动化医学法规文件开发的优势。赞助商希望使用生成式AI节省资源、加速时间表、改善审评人员体验并提高质量。然而,这些团体往往会在法规文件中添加大量不必要的信息,尤其是CSR,导致多次人工审查、修订和相关文件之间出现矛盾的风险。
因此,赞助商需要关注内容和流程准备,以实现生成式AI的潜力。本文将以CSR为例讨论内容准备。
临床研究报告(CSR)
CSR是全面的技术文件,展示了单个临床试验的结果。它们通常包括详细说明研究设计、方法和结果的文字、表格、图表和列表。这些元素共同提供了清晰简洁的研究结果总结。
CSR的目的
CSR是市场授权申请所需临床文件的支柱,法规审评人员严重依赖它们来评估新药的安全性和有效性。然而,CSR并不是独立文件,而是支持药物开发和法规审评的更大文档生态系统的一部分。法规审评人员通常不是基于单个CSR结果评估新药和适应症的风险收益,而是基于随市场授权申请提交的所有数据的总体情况。
法规指南对CSR的要求
现有的法规指南已经过时,无法满足现代法规审评人员的需求,无法跟上医学进步的步伐。法规机构要求客观、无偏见的数据进行全面评估新医疗产品安全性和有效性的评估。主观描述会引入偏差,妨碍知情决策,因此需要消除主观元素以确保法规合规性和评估。
TransCelerate的CSR模板
TransCelerate通过新的模板简化了CSR写作,新模板简化了准备和审评过程,采用了符合法规审评人员要求的结构化格式。新模板还结合了来自行业专家、法规机构和其他利益相关者的反馈。该模板通过引用附录中的详细信息避免了冗余,如研究设计和操作细节等。
尽管引入了TransCelerate的CSR模板和技术进步,过去十年生产CSR所需的时间并未改变。2013年,从收到最终表格、图表和列表(TFL)到文件批准所需的时间为8至15周。最近一项对5家全球制药公司的调查显示,这一时间范围为6至15周。
在自动化之前定义文档内容范围
撰写团队经常在法规文件中添加大量不必要的信息,尤其是CSR,导致多次人工审查、修订和相关文件之间出现矛盾的风险。生成式AI生成的内容取决于它如何训练。如果训练方式与当前撰写团队的操作方式相同,它也会如此。在不改变撰写方式的情况下自动化内容生成只会加速生成大量撰写团队随后需要数周或数月筛选的内容。撰写团队可能会节省生成初稿的时间,但这些时间节省将微不足道。
自动化的第一步是定义明确的范围、写作风格和与法规指南合规的内容详细程度。这是您开始自动化解决方案的基础。
在自动化之前优化内容
为了最大化生成式AI的投资回报,撰写团队必须首先优化其内容。内容优化涉及三个主要任务:消除主观内容、消除冗余内容并与法规要求保持一致。
客观与主观内容在CSR中的对比
客观内容是中立且基于事实的。撰写团队使用客观内容描述与预先设定的统计检验相关的研究结果。这种文本通常出现在疗效部分。这种类型的客观内容适合CSR。临床试验的科学完整性取决于数据展示的客观性。客观描述促进了透明和公正的报告,保护CSR免受个人或机构偏见的影响,维护试验的科学声誉。
相反,主观内容反映了撰写团队成员的个人观点、解释、感受和偏见,这些内容可能因撰写团队成员和审评人员的不同而变化,并可能在药物开发过程中发生变化。主观内容用于描述与预先设定的统计检验无关的研究结果。例如,评论治疗组之间的人口统计学平衡,或某些不良事件或异常实验室结果的发生率是否相似、更高或更低。这种文本通常出现在安全性部分。撰写团队在这些主观判断上的不一致性很容易在CSR内部和CSR之间找到。这种类型的内容不适合CSR。
客观数据描述促进了不同CSR部分之间以及不同研究之间的内容一致性和可比性。这不仅有助于法规审评人员的评估,还增强了报告结果的可靠性和可信度。
重复内容与引用内容
内容重用在文档开发中有其位置。然而,由于技术已经取代了纸质内容撰写和审评环境,引用内容而非重用通常是共享信息的最高效方式。
以下是不适当内容重用的两个场景:
- 协议信息在CSR中的不当重用
- 文本不当重复表格和图表中的数据
协议信息在CSR中的不当重用
撰写团队在CSR引言、目标和方法部分重用了协议信息,在许多情况下将其动词改为过去时态,就像在手稿中一样。虽然协议中的几个要素有助于法规审评人员了解研究的基本设计元素和人群,但撰写团队往往重用了更适合研究现场工作人员的具体细节。一旦研究结束并编写CSR,这些细节从现场工作人员的手册转变为法规审评人员的参考资料。重复协议细节在CSR中是不必要的,因为协议作为附件附加在CSR中。法规审评人员可以通过超链接访问它。
重写协议文本以用于CSR的引言和方法部分会导致错误和过度简化,增加了审评人员的负担。通过引用而非重用,撰写团队可以在撰写和审评过程中节省几天时间,CSR将更短,审评人员无需查找协议与CSR之间的不一致性。
文本不当重复表格和图表中的数据
CSR结果部分的文本应仅呈现关键数字,而其他数字和信息可以在表格和附录中找到。撰写团队经常在CSR结果部分使用文本重复表格和图表中提供的信息。这种冗余带来了两个问题。
首先,文本中的数字比表格中的有序行和列更难以解释。在文本中,页面宽度决定了数字的位置,这意味着审评人员想要比较或理解的数字分散在整个页面上。
其次,将数字放在文本中需要检查转录错误的准确性。为了准备数据准确性检查,作者必须注释每个数据相关陈述的来源。独立审评人员然后必须验证两者之间的一致性。这个过程是法规提交的常见瓶颈。
通过引导审评人员查看经过统计学家验证的表格和图表中的数据,可以使数据更容易解释,并消除准确性检查的需要。
表1展示了三个CSR部分的对比,其中撰写团队消除了主观内容并限制了重复表格和图表中数据的文本。在这三个例子中,数据表格仍然保留在CSR中,提供了所有数字。
表1. CSR部分中带和不带主观内容及重复数据的文本示例
来源: 艾利礼来/诺和诺德
使CSR内容符合法规要求
当然,停止在文本中重复已经在经过验证的数据表格和图表中存在的大量数据将节省时间,并应为撰写团队所接受。然而,本文提出的在CSR中取消主观内容的提议更为激进。习惯了编写主观CSR的撰写团队想知道法规审评人员是否会更喜欢并接受这种做法。
法规审评人员是否会更喜欢这种做法?
TransCelerate的CSR模板说明明确建议不要在CSR中解释数据,而是提供结果的客观总结:“CSR应作为报告研究结果的机制。诸如风险/效益解释的讨论更适合放在总结文件中。” TransCelerate构建其CSR模板时遵循了ICH E3和CORE指南(TransCelerate - 临床内容与重用资产 - 临床研究)。
评估法规审评人员是否更喜欢更客观的CSR的一种方法是咨询曾担任法规审评人员的顾问。这些顾问可以提供宝贵见解,了解他们在市场授权申请评估过程中如何使用临床文件,以及他们理想中希望看到这些文件如何组织和编写。
一个值得考虑的练习是向曾担任法规审评人员的顾问提供两个版本的CSR:
- 撰写团队通常编写的CSR,带有主观内容和冗余内容,如结果文本重复数据展示中的信息;
- 精简版CSR,包含客观描述结果的数据展示,讲述故事。
可以向顾问提出以下问题:
- 您更愿意审评哪个报告?为什么?
- 这些报告中是否有任何一个不足以用于法规审评?为什么?
- 您是否会从较短的报告中删除更多内容?具体来说,您是否会删除探索性目标的摘要?为什么?
- 第1节(引言)和第6节(摘自概要的结论)在法规审评中使用了多少?
- 对于引用协议详细信息的方法部分,对审评人员有何影响(如果有)?
- 第3节(研究计划)是否可以仅引用协议而不包含其他信息?如果不是,哪些部分应保留在审评人员的报告中?
- 对于不包含高层次书面结果摘要的结果部分,对审评人员有何影响?例如:人口统计学、处置、安全性。
- 审评人员是否重视在文本中总结表格中选择的数据点的摘要?
- 在安全性部分,有些患者经历的事件不值得写入患者叙述。在较长版本的研究报告中,这些案例以“简述”形式总结。审评人员是否会自行调查感兴趣的病例,还是依赖简述?或者审评人员会假设这些信息会出现在市场授权申请的其他部分?
- 审评人员花费多少时间审评CSR?
- 审评人员是否在审评CSR中的结果以查看每个报告中的风险是否得到解决?Phase 1 CSR与其他阶段CSR的期望是否有差异?
- FDA的不同部门对CSR中预期的详细程度有不同的期望吗?
- 如果FDA不同部门对CSR中预期的详细程度有不同的期望,申办方是否必须遵守这些未在法规中规定的偏好?申办方如何知道这些偏好,如果这些偏好未记录在指南中?
- 您的“理想CSR”是什么样的?描述其特点、长度等。
这些问题的答案将有助于您的变更管理计划和信息传递,帮助撰写团队采用客观的CSR方法。可以考虑咨询来自FDA和EMA的前审评人员,以及可能来自其他地区的人员。
设计每个文档具有独特目的的内容生态系统
CSR的目的,即客观报告试验数据,类似于生态系统中植物之间的关系。对于CSR,这个生态系统由CTD提交中的所有文档组成。
文档自动化的一部分不仅是定义特定文档(如CSR)的范围,还要将所有文档视为一个内容生态系统,并明确定义每个文档的独特战略目的。
设计一个每个文档都具有独特目的的CTD内容生态系统可以改善法规审评人员的内容体验,同时提高工作效率。此外,了解CTD每个组件的报告风格,无论是客观、描述性还是说服性,将有助于简化这些文档的创建工作流。
CSR应为CTD模块2文档提供数据基础。它们不应讲述临床计划的故事,而应包含构成故事的数据构建块。
CTD模块2摘要文档应讲述临床计划的故事,将药物开发过程中进行的各个实验中收集的所有证据结合起来,形成产品标签的基础。
让我们考虑一下产品标签的一个部分是如何创建的:药物相互作用。在药物开发过程中,公司进行个体体外、临床药理学和群体药代动力学研究,以评估实验药物是否影响依赖同一酶途径的其他药物的药代动力学。单个报告的目的不是为药物贴标签,而是提供离散的证据,供撰写团队用来讲述药物是否有相互作用风险的故事。撰写团队在CTD模块2.7.2中讲述了这个故事,即临床药理学研究摘要。然后,在CTD模块2.5.3中,撰写团队对与药物相互作用相关的药代动力学、药效学和体外数据进行了批判性分析,强调任何异常结果和已知或潜在的问题,或指出缺乏这些问题。
通过为单个报告、CTD模块2摘要和CTD模块2概述分配不同的目的,撰写团队可以避免重复内容。这些文档中的信息不会重复,而是逐步构建到CTD模块2摘要中的故事和CTD模块2概述中的批评。法规审评人员在审评过程中无需反复阅读多个文档中的相同内容,而是可以通过在特定文档中以一致、逻辑的方式查找特定层次的信息,节省时间,这符合法规指南。
结论
总之,在制药行业中大规模部署生成式AI已被证明是一项战略优先事项,在多个治疗领域展现了显著价值。然而,实施生成式AI面临挑战,如数据和内容准备。
为了成功实施,公司必须确保其数据易于访问、安全且机器可读。此外,通过消除冗余信息来优化内容对于最大化生成式AI的投资回报至关重要。通过关注内容和流程准备,制药公司可以利用生成式AI节省资源、加速时间表、改善审评人员体验并提高法规文件的质量。
最终,实现生成式AI全部潜力的关键在于应对这些挑战,并不断改进内容生态系统以满足法规审评人员不断变化的需求。
(全文结束)


