COTA Healthcare最近宣布了一项被称为在真实世界肿瘤学数据(RWD)领域的重大突破。这一成就的核心是一个生成式AI(GenAI)平台,该公司表示,该平台使得大规模癌症数据的整理既准确又盈利,标志着行业尝试自动化劳动密集型RWD抽象过程的重大转变。
“长期以来,精心、专家、劳动密集型的过程一直是RWD数据抽象的核心,但这并不盈利。”COTA Healthcare首席执行官Miruna Sasu指出。
据Sasu介绍,早期尝试自动化数据抽象的努力由于依赖的技术不够可靠,无法获得专家的信任而屡屡失败。她提到,COTA自身也经历了多次技术重新设计的过程,但最终未能达到预期效果。然而,当基础大型语言模型(LLMs)于2023年出现时,COTA开始尝试用这些技术来自动化核心抽象任务和前端查询。
“很快我们意识到,在流程中引入专家抽象师——但不再处于流程前端——将是关键。”Sasu解释道。她描述了一种混合模式,其中最先进的AI完成了大部分初始数据解释工作,而人类肿瘤学家和数据科学家则验证其准确性。
COTA表示,这种新方法显著改变了肿瘤学RWD的操作和财务动态。Sasu指出,每条记录的成本大幅降低,周转时间更快,准确性达到了或超过了以前的标准。
“我们相信COTA是肿瘤学RWD领域首个开发出盈利数据抽象模型的企业。2024年,COTA将每条记录的成本同比减少了23%,推动了EBITDA和现金流的正值增长,同时保持了98%的准确性——远远超过传统方法所需的数小时甚至数天。”Sasu说,“速度、规模和准确性正在持续改进。”
研究发现及其对RWD的重要性
随着学术界和业界研究人员越来越多地依赖RWD来指导药物开发和临床决策,COTA即将发布的研究成果可能具有决定性意义。据Sasu介绍,该组织的研究表明,由GenAI辅助的数据抽象可以实现近乎即时的查询。该公司指出,这种方法的准确性达到了或超过了人类抽象师设定的93%基准。
潜在影响是双重的:它不仅节省了大量时间——将原本需要几天或几周的任务缩短到几分钟或几秒——还使更多人能够访问这些见解。Sasu指出,历史上只有具备专门编程技能的数据科学家才能大规模解释非结构化的EHR数据。COTA的平台“CAILIN”旨在向更广泛的R&D团队开放实时数据探索,包括那些没有正式分析培训的研究人员。
商业指标及其对生命科学的影响
COTA报告称,相比去年,每条记录的成本(CpR)下降了25%,数据抽象处理时间(AHT)减少了32%。该公司的数据库存增加了350%,同时将其签约的抽象师人数减少了40%——所有这些都表明成功过渡到了更加自动化的LLM驱动模型。
在生物制药领域,这项技术意味着可以更快、更精确地识别患者队列,并几乎立即获得治疗模式和生物标志物表达的洞见。以前,任何问题——例如特定癌症亚型中使用某种第三线疗法的患者数量——都需要等待数周,直到数据科学家编写和查询数据后才能得到答案。
据Sasu介绍,CAILIN的搜索引擎界面大大缩短了这一时间,并降低了临床开发、医疗事务和卫生经济学及结果研究(HEOR)等领域研究人员的进入门槛。用户只需在平台界面中输入查询,即可在几秒钟内获得准确的结果。
(全文结束)


