杜克大学研究人员开发评估AI工具的框架以改善医疗保健 - AI与医疗健康

杜克大学研究人员开发评估AI工具的框架以改善医疗保健Duke researchers want to ensure AI is safe in a health care setting

环球医讯 / AI与医疗健康来源：www.msn.com美国 - 英文2025-06-24 17:30:00 - 阅读时长2分钟 - 955字

随着人工智能在医疗领域的应用日益广泛，杜克大学研究人员开发了一种新框架来评估AI工具的表现，特别是在医疗记录和患者回复生成方面，这有助于提高效率并减少错误，但同时也强调需要建立持续监测系统以应对快速发展的技术所带来的挑战。

医疗保健专业人员在日常工作中越来越依赖人工智能，特别是对于耗时的任务如撰写医疗记录。

对此，杜克大学的研究人员正在开发工具，以评估这些AI工具在医院中的表现。

为何重要： Axios此前报道，全国各地的医疗系统正在大力投资人工智能，以此减轻医护人员的负担，并可能改善护理质量。

尽管如此，人们仍担心这些工具有缺陷，有时会产生被称为“幻觉”的错误，可能会对患者造成负面影响。

全局视角： 在医疗保健中使用人工智能的吸引力显而易见，一项研究发现，人工智能将记录时间减少了20%，下班后工作量减少了30%。

根据美国医学协会的一项调查，近三分之二的医生现在在日常工作中使用某种形式的人工智能。

然而，杜克健康中心首席数据科学家迈克尔·彭奇纳（Michael Pencina）告诉Axios，如果例如转录显示了错误的药物，AI笔记中的错误可能会对患者产生“下游后果”。

最新动态： 杜克大学研究人员在本月的两项研究中公布了他们已经开发出一种新框架，用于评估AI模型并监控其长期表现。

这种内部工具结合了人工评估、自动化指标评分和模拟极端案例场景。一项研究检查了AI在撰写医疗记录方面的表现；另一项则着眼于在电子健康记录软件Epic中生成对患者的回复。

共同作者彭奇纳和杜克大学生物统计学教授洪川（Chuan Hong）表示，目标是确保这些工具准确、流畅地传达信息并避免偏见。

深入分析： 对医疗记录工具的研究发现，AI通常能够生成流畅且清晰的笔记，但偶尔会出现不准确的情况。

例如，当处理新药和药物时，其性能显著下降。

在对Epic起草回复的研究中，研究人员发现AI生成的回复大多可接受，只需要提供者进行少量修改。

但他们面临的挑战是偶尔遗漏关键信息，这要求提供者进行重大编辑。

各方观点： 彭奇纳告诉Axios，医疗保健系统需要一种方法来跟上AI工具变化和发展的速度。

他说：“我们真的需要建立一个良好的上市后监测系统，在这些解决方案部署到现实世界时进行持续监测。”

他补充道：“技术发展迅速，我们进行这项研究的部分原因是为了知道我们可以持续运行哪些有效指标来捕捉出现的任何问题。”

下一步计划： 彭奇纳表示，目标是首先在杜克健康中心推出其AI监测框架，一旦对其表现满意，就可以与其他医疗系统分享。

(全文结束)