精准医疗——一种利用患者基因、环境和行为的见解来个性化疾病预防和治疗的方法——依赖于高质量的数据。通过分析来自电子健康记录(EHRs)和其他来源的大量信息,精准医疗有潜力改变各种医疗保健和医学研究应用,包括器官芯片技术、干细胞疗法和癌症护理。在肿瘤学领域,基于分析的精准医疗已经引起了医疗保健和生命科学行业的广泛关注,但整理和处理这些数据仍然是一项挑战。
为了应对这一挑战,社区癌症护理提供商德克萨斯肿瘤学的子公司精密健康信息学(PHI)正与医疗技术公司COTA, Inc.合作,开展AI驱动的数据整理,旨在加速临床点上的精准医疗。
精准医疗中的数据整理挑战
据COTA首席医疗官C.K. Wang博士介绍,癌症护理中的数据处理之所以困难,部分原因是由于EHRs的普及,医疗组织可以访问大量的信息。Wang强调,虽然真实世界数据(RWD)的概念并不新鲜,但医疗记录数据的可访问性是一个较新的发展。在EHR系统出现之前,医疗领域的大部分RWD来源于理赔数据和处方信息,这限制了可用于临床领域的见解。
Wang指出,EHR数据使临床医生和研究人员获得了前所未有的患者和护理模式的新见解。然而,RWD的可用性增加也带来了自身的陷阱。首先,随着可穿戴设备和患者报告结果框架等工具的普及,RWD的范围不断扩大。其次,来自EHR等来源的数据可能是“杂乱的”,需要解析这些信息以进行数据分析工作。
“大多数数据存在于非结构化信息中,”Wang解释道。“尽管近年来越来越多的数据元素变得更加结构化,可以快速提取,但当我们谈论临床真实世界数据时,所需的见解仍主要存在于非结构化数据中。”
Wang表示,即使在技术如AI迅速发展的未来,这项工作仍将需要人类专家的参与,因为需要这些专家来抽象非结构化数据,使其更易于使用。COTA开发了一种名为CAILIN的AI驱动数据整理工具,以简化这一过程,使用户能够像在搜索引擎中一样查询数据集。但即使有了这样的工具,具有医学背景的专家在临床数据抽象中仍然起着关键作用。
Wang还指出,当使用数据进行分析或开发算法时,数据整理的挑战会转变为数据质量的担忧。在AI技术的讨论中,经常提到“垃圾进,垃圾出”的说法,以强调算法的质量取决于其训练数据的质量。在医疗保健行业,这一点尤其重要,无论是AI开发领域内还是外,临床试验的见解都用于创建护理指南和治疗范式。
PHI首席运营官Lori Brisbin解释说,在精准医疗的背景下,将RWD与临床试验数据结合使用特别有用,因为临床试验的参数不一定反映现实场景。只有符合严格标准的患者才有资格参加药物试验,但在实践中,其他患者群体也可能从该药物中受益,尽管剂量或与其他药物的组合可能不同。利用高质量的数据来了解这些患者并提供精准护理是PHI与COTA合作的核心。
建立有意义的合作关系
Brisbin强调,选择合作伙伴帮助PHI改进数据整理和处理时,考虑了临床专业知识和数据分析能力。“COTA拥有非常强大的医学肿瘤学临床知识基础,他们能够查看记录并向我们提出建议,填补可能存在的数据空白,”她说道。
Wang指出,提供者通常意识到其数据的价值,可以帮助改善运营和护理质量,但在决定是与合作伙伴合作还是自行开展数据整理计划时面临障碍。与任何医疗保健领域的数据相关项目一样,人员和资源的投资对提供者来说可能成本高昂。但另一个障碍在于组织的数据整理能力,他将其与数据抽象区分开来。
Wang解释说,数据抽象可以理解为从医疗记录中识别和提取数据元素,这比数据整理简单,后者除了提取外还优先考虑数据质量。一些提供者可能对其希望提取的数据质量没有很好的认识,因此与具有数据质量专业知识的外部合作伙伴合作可能具有潜在价值。标记数据质量问题和空白对癌症护理尤为重要。例如,生存数据对于评估肿瘤学结果很重要,但如果健康系统中因死亡事件未报告而缺失大量此类数据,则这些数据可能无法有效衡量结果。然而,如果组织与数据领域的合作伙伴合作,可能会通过第三方来源补充其EHR数据中的空白。互操作性和EHR生态系统的发展也可能有助于这一过程,但这些挑战的全国规模使得它们不太可能迅速解决。
“这种合作关系的基础是数据和数据洞察力——数据的潜在价值在于为PHI和德克萨斯肿瘤学提供对其患者群体的洞察,然后他们可以将这些洞察叠加在其IT技术上以满足其需求,”Wang表示。
将AI带入精准医疗
该合作正在帮助PHI进行假设驱动的研究和临床试验丰富,这对推进癌症护理至关重要。Brisbin指出,自与COTA合作使用AI驱动的数据整理以来,PHI的流失率——衡量研究中参与者损失的指标——已显著改善。“我们与COTA的合作流失率比其他任何数据聚合商都要低。这意味着如果我们发送100份记录,他们将使用其中的87份记录——没有任何缺失的数据元素——来贡献研究。这是非常高的比例,”她表示,一些PHI最初考虑的其他潜在合作伙伴的流失率约为50%。
AI还使PHI能够简化临床试验的纳入。这些试验的纳入和排除标准非常严格——共病等因素只是众多可能导致患者无法参与试验的因素之一。确定患者的试验资格需要筛选整个医疗记录,但有了整理良好的数据,这一过程更加直接。AI功能的加入进一步简化了这些努力,通过关键词搜索和其他工作流程增强功能,使确定资格变得不那么繁琐。
Brisbin强调,AI有助于减轻PHI员工的行政任务负担。“如果你用AI寻找狗的照片,你会得到各种各样的狗。所以,假设你需要缩小范围到只看德国牧羊犬,”她说,“你会得到德国牧羊犬,但也可能得到狼、哈士奇甚至土狼。你会得到很多需要有人查看并说‘这不是德国牧羊犬,是土狼’的东西。”“这就是我们的意思——AI将为我们缩小临床数据范围,使人们的工作更容易,让专家们专注于更高层次的经验,让他们能够在最高水平上工作,”她总结道。
(全文结束)


