杜克大学研究人员开发评估医疗AI工具的框架以应对行业挑战

Duke researchers want to ensure AI is safe in a health care setting

美国英文科技与健康
新闻源:Axios on MSN
2025-06-24 17:30:00阅读时长2分钟972字
医疗AI评估框架医疗保健患者健康医疗笔记记录Epic软件工具准确性上市后监测护理质量杜克大学

医疗保健专业人员在日常工作中越来越多地使用人工智能(AI),尤其是在耗时的任务上,例如记录医疗笔记。

对此,杜克大学(Duke University)的研究人员正在开发工具,以评估这些人工智能工具在医院中的表现。

为什么这很重要:正如Axios此前报道,全美各地的医疗系统正在大力投资人工智能,希望通过这种方式减轻医护人员的职业倦怠,并可能提高护理质量。

  • 然而,人们仍然担心这些工具有所不足,有时会产生被称为“幻觉”的错误,这可能会对患者造成负面影响。

背景:在医疗领域使用人工智能的吸引力显而易见。一项研究发现,人工智能使记录笔记的时间减少了20%,下班后的工作量减少了30%。

  • 根据美国医学协会(American Medical Association)的一项调查,近三分之二的医生现在在日常工作中使用某种形式的人工智能。
  • 然而,杜克健康(Duke Health)首席数据科学家迈克尔·彭奇纳(Michael Pencina)告诉Axios,如果转录中写错了药物,人工智能笔记中的错误可能会对患者产生“下游后果”。

最新动态:本月,杜克大学的研究人员在两项研究中公布了他们开发的新框架,用于评估人工智能模型并监测其长期表现。

  • 这一内部工具结合了人工评估、自动化评分以及模拟边缘案例场景。其中一项研究考察了人工智能在记录医疗笔记方面的表现;另一项则探讨了它在Epic(一种电子健康记录软件)中生成患者回复的能力。
  • 该研究的合著者彭奇纳和杜克大学生物统计学教授洪传(Chuan Hong)表示,目标是确保这些工具准确、流畅地传达信息,并避免偏见。

深入探讨:关于医疗笔记记录工具的研究发现,人工智能通常能生成流畅且清晰的笔记,但偶尔会出现不准确的情况。

  • 例如,在处理新药和新药物时,其表现显著下降。

在研究Epic中起草回复的功能时,研究人员发现,人工智能生成的回复总体上是可以接受的,医生只需进行少量修改。

  • 但它们偶尔会遗漏关键信息,导致医生需要大幅修改。

专家观点:彭奇纳告诉Axios,医疗系统需要一种方法来跟上人工智能工具快速变化和发展的步伐。

  • 他表示:“我们真的需要建立一个良好的上市后监测系统,在这些解决方案部署到现实世界时进行持续监控。”
  • 他补充道:“这项技术发展迅速,我们进行这项研究的部分原因是为了了解哪些高效指标可以持续运行,从而捕捉任何出现的问题。”

下一步计划:彭奇纳表示,目标是首先在杜克健康内部推出这一人工智能监测框架,一旦对其表现满意,就可以与其他医疗系统分享。


(全文结束)

声明:本文仅代表作者观点,不代表本站立场,如有侵权请联系我们删除。

本页内容撰写过程部分涉及AI生成(包括且不限于题材,素材,提纲的搜集与整理),请注意甄别。