研究发现ChatGPT在急诊中过度开具不必要的X光片和抗生素ChatGPT over prescribed unneeded x-rays & antibiotics in emergency care: Study

环球医讯 / AI与医疗健康来源:www.daijiworld.com美国 - 英语2024-10-08 21:00:00 - 阅读时长2分钟 - 763字
一项由加州大学旧金山分校领导的研究发现,尽管ChatGPT在与患者互动和通过医学考试方面表现出色,但在急诊中可能会过度开具不必要的X光片和抗生素。
ChatGPT急诊不必要X光片抗生素加州大学旧金山分校自然通讯临床判断人类医生
研究发现ChatGPT在急诊中过度开具不必要的X光片和抗生素

新德里,10月8日(IANS):尽管ChatGPT在与患者互动和通过医学考试方面表现出色,但这项由OpenAI开发的流行生成式人工智能(AI)平台在急诊中可能会过度开具不必要的X光片和抗生素,这是周二发布的一项研究的结果。该研究由加州大学旧金山分校(UCSF)的研究人员领导,研究结果发表在《自然通讯》杂志上。研究人员表示,虽然可以通过特定提示使模型的响应更加准确,但它仍然无法与人类医生的临床判断相匹敌。

“这是对临床医生的一个重要信息,不要盲目信任这些模型,”UCSF的博士后研究员克里斯·威廉姆斯(Chris Williams)说。“ChatGPT可以回答医学考试问题和帮助起草临床笔记,但目前它并不适用于需要多方面考虑的情况,如急诊科的情况。”

最近,威廉姆斯的一项研究表明,ChatGPT这一大型语言模型(LLM)在确定两名急诊患者中哪一位病情更严重方面略优于人类——这是一个简单的选择题,即选择患者A或患者B。在当前的研究中,他挑战了AI模型执行一个更复杂的任务:提供医生在初步检查患者后所做的建议——是否收治患者、进行X光或其他扫描,或开具抗生素。

为了每个决定,研究团队从超过251,000次访问记录中编制了1,000次急诊访问数据集。这些数据集中,关于住院、放射学和抗生素的决策比例相同。研究团队将每位患者的症状和检查结果的医生笔记输入ChatGPT-3.5和ChatGPT-4。然后,通过不断增加详细提示来测试每组数据的准确性。

结果显示,AI模型推荐的服务比实际需要的更多。虽然ChatGPT-4的准确性比住院医师低8%,但ChatGPT-3.5的准确性低24%。

“AI倾向于过度开具处方,因为这些模型是在互联网上训练的。到目前为止,还没有设计出能够回答紧急医疗问题的合法医疗建议网站。”


(全文结束)

大健康
大健康