德累斯顿工业大学
在肿瘤学中进行临床决策是一项挑战性的工作,需要分析各种类型的数据——从医学影像和基因信息到患者记录和治疗指南。为了有效支持医疗实践,AI模型必须能够处理多模态数据,并具备类似于人类的推理和解决问题的能力。
为了构建一个用于精准医疗的自主AI代理,研究人员对大型语言模型GPT-4进行了增强,增加了多种数字工具——包括从MRI和CT扫描生成放射学报告、医学图像分析、直接从组织病理学切片预测基因突变,以及在PubMed、Google和OncoKB等平台上进行搜索的功能。为了确保决策基于当前的医学知识,该模型被提供了大约6,800份来自官方肿瘤学指南和临床资源的文档。
自主AI代理在现实模拟患者案例中的成功测试
该AI代理在20个现实模拟患者案例中进行了评估,评估过程分为两步:首先,系统选择适当的工具,然后检索相关医学信息以指导其推理。输出结果由人类医学专家审查,以确保准确性、完整性和正确引用来源。该AI代理在91%的案例中得出了正确的临床结论,并在其超过75%的回答中准确引用了相关的肿瘤学指南。重要的是,使用专业工具和医学信息检索显著提高了模型的性能。因此,所谓的“幻觉”——看似合理但不正确的陈述——显著减少。这一改进在敏感的医疗领域尤为重要。
“AI工具旨在支持医务人员,为他们腾出宝贵的时间来照顾患者,”该研究的第一作者Dyke Ferber说。“它们可以帮助日常决策过程,并支持医生了解最新的治疗建议,从而有助于确定癌症患者的最佳个性化护理。”
未来在日常临床实践中的潜在支持
这项研究作为原理证明,表明AI代理可以设计成支持肿瘤学家在日常临床实践中。尽管取得了令人鼓舞的结果,研究人员也承认当前研究的局限性。该系统仅在少数模拟案例上进行了测试,需要进一步验证。未来的工作将集中在整合对话能力与人类反馈——即所谓的“人在环路”交互——并通过部署在本地服务器上来确保数据隐私。
“要充分发挥AI代理在未来的作用,关键在于将其无缝集成到常规临床实践中,尽量减少干扰,”德累斯顿工业大学EKFZ数字健康中心临床人工智能教授Jakob N. Kather表示,他也是德累斯顿大学医院Carl Gustav Carus的肿瘤学家。“诸如与现有系统的互操作性、遵守数据隐私法律、作为医疗器械的监管批准流程以及确保问责制等问题仍需解决。”
长期来看,研究团队设想类似的AI代理可以适应其他医学领域——前提是它们配备了适当的工具和数据。“为了成功实施医疗AI代理,医务人员需要接受良好的教育,以便有效地与这些系统合作,同时保持对最终临床决策的完全控制权,”Kather教授补充道。“这些代理旨在支持临床医生,但绝不是取代他们。”
总体而言,该研究表明,当大型语言模型与精准肿瘤学和搜索工具结合时,具有巨大的潜力,为未来在临床实践中使用AI驱动的个性化支持系统奠定了坚实的基础。
(全文结束)


