Foresight是一款生成式AI模型,它能够根据之前的医疗事件来预测接下来会发生什么。这类似于ChatGPT这样的模型,后者根据之前从互联网上获取的数据来预测句子中的下一个单词。
Foresight正在接受常规收集的、去标识化的NHS数据的训练,如医院入院记录和COVID-19疫苗接种率,以预测英格兰各患者群体的潜在健康结果。这些结果可能包括住院、心脏病发作或新诊断。早期预测这些事件可以实现有针对性的干预,从而转向更大规模的预防性医疗服务。
这项试点研究完全在NHS England安全数据环境(SDE)内进行,这是一个安全的数据和研究分析平台,通过提供对英格兰5700万居民的去标识化健康数据的受控访问,使这一开创性工作成为可能。只有通过NHS England SDE,才能在如此大规模的数据下进行访问,同时确保AI模型和所有患者数据都受到严格的NHS控制。
由于涵盖了英格兰整个人口的数据,该模型可以对所有人口统计学特征和罕见病的健康结果进行预测。
来自UCL的主要研究员Chris Tomlinson博士说:“AI模型的好坏取决于其训练所用的数据。如果我们希望一个模型能够惠及所有患者及其所有疾病,那么AI需要在训练过程中看到这些情况。使用全国规模的数据使我们能够代表英格兰人口的多样性,特别是少数群体和罕见病,这些群体和疾病通常被排除在研究之外。”
经过严格的审批程序,英国心脏基金会数据科学中心在Health Data Research UK的支持下,使研究人员能够访问并在这个SDE中工作。该中心还让公众成员参与其中,他们继续为批准和塑造研究做出贡献。
研究人员认为,该模型的预测能力可以识别高风险患者群体,从而打开干预窗口,改善和挽救生命。由于训练数据的多样性和完整性,该模型还有助于突出和解决医疗不平等问题。此外,能够在人口层面上分析医疗风险和结果,可以为NHS在规划方面提供关键支持。
来自UCL的AI博士研究员Simon Ellershaw说:“将AI所需的计算资源与NHS数据结合起来一直是一个挑战,但多亏了合作伙伴的支持,我们能够安全且大规模地将最先进的AI方法应用于NHS数据。”
这项试点研究是在一个安全和受保护的环境中测试模型的机会,保护隐私,并且所有预测都经过严格测试,以验证其与现实世界结果的准确性。目前,该模型正在使用从2018年11月到2023年底的最新数据,用于有限数量的数据集,并已提供给COVID-19研究。
NIHR Maudsley生物医学研究中心副主任兼King's和UCL的另一名主要研究员Richard Dobson教授说:“这项试点研究建立在先前的研究基础上,证明了Foresight能够从两个NHS信托机构的数据中预测健康轨迹。能够在国家层面使用它是非常令人兴奋的,因为它可能会展示出更强大的预测能力,从而为全国和地方服务提供信息。”
“目前,这项试点研究的数据范围广泛但深度较浅,最终我们希望能够利用Foresight背后的专家知识和AI平台,包括更丰富的信息来源,例如临床医生的笔记或检查结果,如血液检测和扫描,如果这些数据变得可用的话。”
未来,研究人员希望进一步训练该模型,使用更深层次的数据源,回溯更久的时间。他们还在探索如何负责任地扩展模型的范围,目前该模型仅限于与COVID相关的研究。
然而,研究人员明确表示:患者和公众必须处于任何关于模型使用和预测的指导的核心位置,以确保这项研究及其应用符合他们的最佳利益。
一位参与审查和批准该项目的BHF数据科学中心公众贡献者说:“作为一名患者,我对这项研究如何帮助识别相关健康状况、降低新发疾病的风险以及支持那些面临医疗保健挑战的人感兴趣。”
“重要的是,人们应该知道他们的健康数据是如何被使用的,因此看到对透明度的关注并确保AI在NHS中的安全、伦理使用,以公共利益为核心,这是令人鼓舞的。”
NHS England转型国家总监Vin Diwakar博士说:“如果在大规模数据集上训练并在安全测试后,AI有可能改变我们预防和治疗疾病的方式。NHS安全数据环境对于这项开创性研究至关重要,塑造了一个未来,在这个未来中,早期治疗和干预将针对那些受益者,防止未来的健康问题。这将增强我们快速迈向个性化、预防性护理的能力。”
英国心脏基金会数据科学中心副主任Angela Wood教授说:“在如此大规模的情况下利用AI与NHS数据结合,代表了健康数据研究的巨大进步。”
“Foresight模型有潜力支持医疗专业人员为高风险患者做出及时有效的医疗决策,并通过确保每个人都在预测性医疗中得到代表,帮助解决医疗不平等问题。这项由BHF数据科学中心支持的开创性工作展示了英国在可信使用AI以改变生活方面的领导地位。”
(全文结束)


